확률변수의 기대값
\[\mu x = E[X] = \sum_{x_i \in \Omega} x_ip(x_i)\] 확률질량함수 \(p(x_i)\)에 주의!
연속확률변수의 기대값은 \[\mu x = E[X] = \int_{-\infty}^{\infty}xp(x)dx\]
기대값은 여러 가능한 x의 값을 확률(또는 확률밀도)값에 따라 가중합을 한것이므로, 가장 확률이 높은 x값 근처의 값이 된다. 다시말해, 확률(또는 확률밀도)가 모여있는 곳의 위치를 나타낸다.
기대값의 성질
확률변수가 아닌 상수 \(c\)에 대해 \[E[c] = c\]
선형성 \[E[cX] = cE[X]\] \[E[X + Y] = E[X] + E[Y]\] \[E[c_1X + c_2Y] = c_1E[X] + c_2E[Y]\]
확률변수의 변환
\[ Y = f(X)\]
- 확률변수를 사용하여 새로운 확률변수를 만드는것을 확률변수의 변환이라 한다.
통계량
- 확률변수 \(X\)로 부터 얻은 데이터집합의 모든 값을 정해진 어떤 공식에 넣어서 하나의 숫자를 구한것을 통계량이라고 한다.
- 표본의합, 표본평균, 표본중앙값, 표본분산등은 모두 통계량이다.
- 통계량도 확률변수의 변환에 포함된다.
표본평균 확률변수
- 확률변수로 부터 \(N\)개의 확률변수 복사본을 만들어 각 확률변수가 만들어낸 표본집합의 표본평균을 구하면 이 값도 확률변수가 된다.
- 표본평균 확률변수는 원래의 확률변수 이름에 윗줄을 추가하여 \(\bar X\)로 표시한다
\[\bar X = {1 \over N} \sum_{i=1}^N X_i\]
기대값과 표본평균의 관계
- 표본평균도 확률변수이므로 기대값이 존재하고, 아래와 같은 관계가 성립한다.
\[E[\bar X] = E[X]\]
- 이 식의 의미는 > 표본평균은 확률변수의 기대값 근처의 값이 된다.
- 예를들어 공정한 주사위의 기대값은 3.5이다. 이 주사위를 던져 나온 값의 평균, 즉 표본평균은 3.623456 또는 3.405985등 처럼 항상 3.5근처의 값이 나온다.
중앙값
- 확률변수의 중앙값은 중앙값보다 큰 값이 나올 확률과 작은 값이 나올 확률이 0.5로 같은 값을 뜻한다.
최빈값
- 이산확률분포에서는 가장 확률값이 큰 수를 최빈값이라고 한다.
- 연속확률분포의 최빈값은 확률밀도함수 \(p(x)\)의 값이 가장큰 확률변수의 값이다.
- 최빈값 = $ p(x)$