확률분포
- 확률분포: 어떤 사건에 어느 정도의 확률이 할당되었는지 묘사한 정보
- 확률분포를 묘사하려면 모든 사건들을 일일히 제시하고 할당된 숫자를 보여줘어야 한다
단순사건과 확률질량함수
- 단순사건(elementary event, atomic event): 표본이 하나인 사건
- 확률질량함수(probability mass function)
- 유한 개의 사건이 존재하는 경우 각 단일 사건(원소)에 대한 확률만 정의하는 함수(p)
- \[p(a) = P(\{a\})\]
표본 수가 무한한 경우
- 표본 수가 무한하면 확률질량함수를 사용하여 확률을 정의할 수 없다.
- 표본 수가 무한하고 모든 표본에 대해 표본 하나만을 가진 사건의 확률이 동일하다면, 표본 하나에 대한 사건의 확률은 언제나 0이기 때문이다.
- 따라서 표본 수가 무한하면 사건에 대해 확률을 할당해야 한다.
구간
- \[A = \{ a < x \leq b \}\]
- \[P(A) = P(\{ a < x \leq b \}) = P(a, b)\]
- 예시
- \[B = \{ -2 < x \leq 1 \ or\ 2 < x \leq 3 \}\]
- \[P(B) = P(\{ -2 < x \leq 1 \}) + P(\{ 2 < x \leq 3\}) = P(-2, 1) + P(2, 3)\]
누적분포함수
- 구간을 정의할때 시작점을 모두 똑같이 음의 무한대로 통일한 특수한 구간의 확률분포를 묘사하는 함수
- \[F(x) = P(S_x) = P(\{ X < x \})\]
- \[S_x = \{-\infty< X \leq x \}\]
- \(P(-\infty, b) = P(-\infty, a) + P(a, b)\)
\(F(b) = F(a) + P(a, b)\)
\(P(a,b) = F(b) - F(a)\) - \[F(-\infty) = 0\]
- \[F(\infty) = 1\]
- \[x > y \rightarrow F(x) \geq F(y)\]
확률밀도함수
- 확률밀도함수(probability density function): 누적분포함수를 미분하여 구한 도함수
- \[p(x) = {dF(x) \over dx}\]
- \(\lim_{dx \rightarrow 0} {P(\{x_1 < x \leq x_1 +dx\}) \over dx}\)
\(= \lim_{dx \rightarrow 0} {F(x_1 +dx) - F(x_1) \over dx}\)
\(= x_1\)에서 \(F(x)\) 의 기울기 - \(p(x) \geq 0\) (적분함수인 누적분포함수의 기울기가 음수가 될 수 없기 때문에)
- \[\int_{-\infty}^{\infty} p(u)du = 1\]
연습문제
- 6.4.1
- 0.1 + 0.1 = 0.2
- 0.1 + 0.1 + 0.5 = 0.7
- 6.4.2
- \[P(\{0 < \theta \leq 180\}) = {2 \over 3}\]
- \[P(\{180 < \theta \leq 360\}) = {1 \over 3}\]
- 6.4.3
- \[P(0, 180) = {2 \over 3}\]
- \[P(180, 360) = {1 \over 3}\]
- 6.4.4
- \[F(180) = {2 \over 3}\]
- \[F(360) = {1}\]
- 6.4.5
- \[p(0< x \leq 180) = {1 \over 270}\]
- \[p(180 < x \leq 360) = {1 \over 540}\]
이 글은 ‘데이터 사이언스 스쿨 수학편’을 정리한 것입니다.
질문이나 오류가 있다면 댓글 남겨주세요.