0%

기대값과 확률변수의 변환

확률변수의 기대값

  • 확률변수의 확률밀도함수를 알면 확률변수의 이론적 평균값을 구할수 있다. 이런 이론적 평균을 확률변수의 기대값이라 한다.

  • 이산확률변수의 기대값은

\[\mu x = E[X] = \sum_{x_i \in \Omega} x_ip(x_i)\] 확률질량함수 \(p(x_i)\)에 주의!

  • 연속확률변수의 기대값은 \[\mu x = E[X] = \int_{-\infty}^{\infty}xp(x)dx\]

  • 기대값은 여러 가능한 x의 값을 확률(또는 확률밀도)값에 따라 가중합을 한것이므로, 가장 확률이 높은 x값 근처의 값이 된다. 다시말해, 확률(또는 확률밀도)가 모여있는 곳의 위치를 나타낸다.

기대값의 성질

  • 확률변수가 아닌 상수 \(c\)에 대해 \[E[c] = c\]

  • 선형성 \[E[cX] = cE[X]\] \[E[X + Y] = E[X] + E[Y]\] \[E[c_1X + c_2Y] = c_1E[X] + c_2E[Y]\]

확률변수의 변환

\[ Y = f(X)\]

  • 확률변수를 사용하여 새로운 확률변수를 만드는것을 확률변수의 변환이라 한다.

통계량

  • 확률변수 \(X\)로 부터 얻은 데이터집합의 모든 값을 정해진 어떤 공식에 넣어서 하나의 숫자를 구한것을 통계량이라고 한다.
  • 표본의합, 표본평균, 표본중앙값, 표본분산등은 모두 통계량이다.
  • 통계량도 확률변수의 변환에 포함된다.

표본평균 확률변수

  • 확률변수로 부터 \(N\)개의 확률변수 복사본을 만들어 각 확률변수가 만들어낸 표본집합의 표본평균을 구하면 이 값도 확률변수가 된다.
  • 표본평균 확률변수는 원래의 확률변수 이름에 윗줄을 추가하여 \(\bar X\)로 표시한다

\[\bar X = {1 \over N} \sum_{i=1}^N X_i\]

기대값과 표본평균의 관계

  • 표본평균도 확률변수이므로 기대값이 존재하고, 아래와 같은 관계가 성립한다.

\[E[\bar X] = E[X]\]

  • 이 식의 의미는 > 표본평균은 확률변수의 기대값 근처의 값이 된다.
    • 예를들어 공정한 주사위의 기대값은 3.5이다. 이 주사위를 던져 나온 값의 평균, 즉 표본평균은 3.623456 또는 3.405985등 처럼 항상 3.5근처의 값이 나온다.

중앙값

  • 확률변수의 중앙값은 중앙값보다 큰 값이 나올 확률과 작은 값이 나올 확률이 0.5로 같은 값을 뜻한다.

최빈값

  • 이산확률분포에서는 가장 확률값이 큰 수를 최빈값이라고 한다.
  • 연속확률분포의 최빈값은 확률밀도함수 \(p(x)\)의 값이 가장큰 확률변수의 값이다.
  • 최빈값 = $ p(x)$