0%

베르누이분포, 이항분포란?

베르누이 시행(Bernoulli trial)

  • 결과가 두가지 중 하나로만 나오는 실험이나 시행

베르누이 확률변수

  • 베르누이 시행결과를 0 또는 1로 바꾼것을 베르누이 확률변수라고 한다.
  • 베르누이 확률변수는 두 값중 하나만 가지므로, 셀수있는 이산확률변수이다.

베르누이 확률분포

  • 베르누이 확률변수의 분포를 베르누이 확률분포라고 한다.
  • 어떤 확률변수 \(X\)가 베르누이분포에 의해 발생된다면, 확률변수 $X$가 베르누이분포를 따른다 라고 명명한다.

\[X \sim Bern(x;\,u)\]

  • 베르누이 분포의 확률질량함수(pmf)의 수식은 \[Bern(x;\mu) = \mu^x(1-\mu)^{(1-x)}\]

베르누이분포의 모멘트

  • 기대값

\[E[X] = \mu\]

  • 분산

\[Var[x] = \mu(1-\mu)\]

이항분포(bianomial distribution)

  • 성공확률이 \(\mu\)인 베르누이 시행을 \(N\)번 반복하는 경우, 성공한 횟수를 확률변수 \(X\)라고 한다면 \(X\)의 값은 0부터 \(N\)까지의 정수중 하나가 된다.
  • 이런 확률변수를 이항분포를 따르는 확률변수라고 한다

\[X \sim Bin(x;N,\mu)\]

  • 이항분포를 따르는 확률변수 \(X\)의 확률질량함수

\[Bin(x;N,\mu) = \begin{pmatrix} N \\ x \end{pmatrix} \mu^x(1-\mu)^{N-x}\]

\[\begin{pmatrix} N \\ x \end{pmatrix} = {N! \over x!(N -x)!}\]

이항분포의 모멘트

  • 기대값

\[E[X] = N\mu\]

  • 분산

\[Var[X] = N\mu(1-\mu)\]

베르누이분포와 이항분포의 모수추정

  • 데이터에서 모수의 값을 찾아내는 과정을 모수추정이라고 한다.

\[\hat \mu = {\sum_{i=1}^{N}x_i \over N} = {N_1 \over N}\]

  • \(N\)은 전체 데이터의수, \(N_1\)은 1이 나온 횟수이다.

베르누이 분포를 활용한 스팸메일 예제