확률
- 확률이란 사건(표본공간의 부분집합)을 입력으로 받는 함수!
- 확률의 정의역은 표본공간의 가능한 모든 부분집합
- 표본공간 : 가능한 모든 표본의 집합
- 사건 : 부분집합
- 콜모고로프의 공리
- 모든 사건에 대해 확률은 실수이고 0또는 양수다
$P(A) $
- 표본공간(전체집합)이라는 사건(부분집합)에 대한 확률은 1이다.
\(p(\Omega) = 1\)
- 공통 원소가 없는 두 사건의 합집합의 확률은 사건별 확률의 합이다.
$A B = P(A B) = P(A) + P(B) $
- 모든 사건에 대해 확률은 실수이고 0또는 양수다
확률의 의미
- 확률이란 사건(부분집합)을 입력하면 숫자(확률값)이 출력되는 함수다.
- 빈도주의적 관점
- 반복적으로 선택된 표본이 사건(부분 집합) A의 원소가될 경향을 사건의 확률이라고 본다.
- 베이지안 관점
- 선택된 표본이 특정한 사건(부분 집합)에 속한다는 가설(hypothesis), 명제(proposition) 혹은 주장(assertion) 의 신뢰도(degree of belief)
- 베이지안 관점에서 사건이 일어났다(occur) 혹은 발생했다하는 말은 그 사건(부분집합)의 원소 중에 정말로 선택된 표본이 있다는 사실을 알게 되었다는 것을 말한다.
확률의 성질
- 공집합의 확률 : 공집합의 확률은 0이다
$P() = 0 $
- 여집합의 확률 : 어떤 사건의 여집합인 사건의 확률은 (1 - 원래 사건의 확률)과 같다.
$ P(A^c) = 1 - P(A) $ , $ 0 P(A) $
- 포함-배제원리 : 두사건의 합집합의 확률은 각 사건의 확률의 합에서 두 사건의 교집합의 확률을 뺸것과 같다
$ P(A B) = P(A) + P(B) - P(AB) $
- 전체확률의 법칙
복수의 사건 \(C_{i}\)가 다음을 만족하는 사건들이라고 가정한다.
- 서로 교집합이 없다. 서로 배타적이다.
$ C_iC_j = $
- 모든 집합의 합집합이 전체집합이다.
$ C_1C_2 = $
이경우
사건 A의 확률은 사건 A와 사건 \(C_i\)가 동시에 발생할 사건들의 확률의 합과 같다. $ P(A) = _{i} P(A C_i)$
확률 분포 함수
- 확률질량함수(PMF) : 유한개의 사건이 존재하는 경우 각 단순사건에 대한 확률만 정의하는 함수
$ p(1) = 0.2 P({1})=0.2$
- 누적분포함수(CDF): 무한개의 사건이 존재하는 경우, 시작점을 \(-\infty\)로 고정하고 통일된 특수구간을 사용하는 함수
- 음의 무한대에 대한 누적분포함수값은 0이다
$ F(-) = 0 $
- 양의 무한대에 대한 누적분포함수값은 1이다.
$ F(+) = 1$
- 입력이 크면 누적분포함수값은 같거나 커진다.
$ x y F(x)F(y)$
- 단조증가 성질에 따라 절대 내려가지 않는다.
- 음의 무한대에 대한 누적분포함수값은 0이다
- 확률밀도함수(PDF): 누적분포 함수를 미분하여 구한 도함수, 어떤 확률 변수값이 더 자주 나오는지에 대해 잘 파악할수 있다.
- 누적분포함수의 기울기가 음수가 될수 없기 때문에(단조증가 성질, 절대 값이 내려가지 않기 때문에) pdf는 0보다 같거나 크다.
$ p(x) $
- \(-\infty\)부터 \(\infty\)까지 적분하면 표본공간의 확률이 되므로 값은 1이다.
$ ^{-}_{}p(u)du = 1$$
- 누적분포함수의 기울기가 음수가 될수 없기 때문에(단조증가 성질, 절대 값이 내려가지 않기 때문에) pdf는 0보다 같거나 크다.