확률분포

  • 확률분포: 어떤 사건에 어느 정도의 확률이 할당되었는지 묘사한 정보
  • 확률분포를 묘사하려면 모든 사건들을 일일히 제시하고 할당된 숫자를 보여줘어야 한다

단순사건과 확률질량함수

  • 단순사건(elementary event, atomic event): 표본이 하나인 사건
  • 확률질량함수(probability mass function)
    • 유한 개의 사건이 존재하는 경우 각 단일 사건(원소)에 대한 확률만 정의하는 함수(p)
  • \[p(a) = P(\{a\})\]

표본 수가 무한한 경우

  • 표본 수가 무한하면 확률질량함수를 사용하여 확률을 정의할 수 없다.
  • 표본 수가 무한하고 모든 표본에 대해 표본 하나만을 가진 사건의 확률이 동일하다면, 표본 하나에 대한 사건의 확률은 언제나 0이기 때문이다.
  • 따라서 표본 수가 무한하면 사건에 대해 확률을 할당해야 한다.

구간

  • \[A = \{ a < x \leq b \}\]
  • \[P(A) = P(\{ a < x \leq b \}) = P(a, b)\]
  • 예시
    • \[B = \{ -2 < x \leq 1 \ or\ 2 < x \leq 3 \}\]
    • \[P(B) = P(\{ -2 < x \leq 1 \}) + P(\{ 2 < x \leq 3\}) = P(-2, 1) + P(2, 3)\]

누적분포함수

  • 구간을 정의할때 시작점을 모두 똑같이 음의 무한대로 통일한 특수한 구간의 확률분포를 묘사하는 함수
  • \[F(x) = P(S_x) = P(\{ X < x \})\]
  • \[S_x = \{-\infty< X \leq x \}\]
  • \(P(-\infty, b) = P(-\infty, a) + P(a, b)\)
    \(F(b) = F(a) + P(a, b)\)
    \(P(a,b) = F(b) - F(a)\)
  • \[F(-\infty) = 0\]
  • \[F(\infty) = 1\]
  • \[x > y \rightarrow F(x) \geq F(y)\]

확률밀도함수

  • 확률밀도함수(probability density function): 누적분포함수를 미분하여 구한 도함수
  • \[p(x) = {dF(x) \over dx}\]
  • \(\lim_{dx \rightarrow 0} {P(\{x_1 < x \leq x_1 +dx\}) \over dx}\)
    \(= \lim_{dx \rightarrow 0} {F(x_1 +dx) - F(x_1) \over dx}\)
    \(= x_1\)에서 \(F(x)\) 의 기울기
  • \(p(x) \geq 0\) (적분함수인 누적분포함수의 기울기가 음수가 될 수 없기 때문에)
  • \[\int_{-\infty}^{\infty} p(u)du = 1\]

연습문제

  • 6.4.1
    1. 0.1 + 0.1 = 0.2
    2. 0.1 + 0.1 + 0.5 = 0.7
  • 6.4.2
    • \[P(\{0 < \theta \leq 180\}) = {2 \over 3}\]
    • \[P(\{180 < \theta \leq 360\}) = {1 \over 3}\]
  • 6.4.3
    • \[P(0, 180) = {2 \over 3}\]
    • \[P(180, 360) = {1 \over 3}\]
  • 6.4.4
    • \[F(180) = {2 \over 3}\]
    • \[F(360) = {1}\]
  • 6.4.5
    • \[p(0< x \leq 180) = {1 \over 270}\]
    • \[p(180 < x \leq 360) = {1 \over 540}\]



이 글은 ‘데이터 사이언스 스쿨 수학편’을 정리한 것입니다. 질문이나 오류가 있다면 댓글 남겨주세요.