6.2 확률의 수학적 정의와 의미

Aug 10, 2021

표본공간과 확률표본

표본공간(sample space)
- 가능한 모든 확률표본의 집합 (\(\Omega\))
확률표본(probabilistic sample, random sample)
- 풀고자 하는 확률적 문제에서 발생할 수 있는 하나의 현상
- 선택될 수 있는 하나의 경우
- = 표본(sample)
집합(set): 구별 가능한 객체의 모임 (보통 알파벳 대문자로 표기)
원소(element): 집합에 포함된 구별 가능한 객체 (보통 알파벳 소문자로 표기)
예시
- \[x \in A\]
- \[x \notin A\]
- \[A = \{1, 2, 3\} \rightarrow 1 \in A, 4 \notin A\]

사건

사건
- 표본공간의 부분집합
- 보통 알파벳 대문자로 표기

확률

확률(P): 사건을 입력했을 때 확률값이 출력되는 함수
정의역(domain): 표본공간의 모든 사건의 집합
규칙(Kolmogorov’s axioms)
- \[P(A) \geq 0\]
- \[P(\Omega) = 1\]
- \[A \cap B = \emptyset \rightarrow P(A \cup B) = P(A) + P(B)\]

확률은 표본이 아닌 사건을 입력으로 가지는 함수

오류: 확률이 표본 하나 하나에 대해 정의되 있는 숫자 (\(P(1) = {1 \over 6}\))
확률은 표본이 아닌 사건에 대해 정의한다 (\(P(\{1\}) = {1 \over 6}\))

주사위 한 면의 확률은 무조건 1/6?

콜모코로프의 공리를 따른다면 주사위에 어떤 조작이든 가능하기 때문에 항상 그렇지는 않다.

확률의 의미

빈도주의(Frequentist)
- 사건의 확률: 반복적으로 선택된 표본이 사건의 원소가 될 경향
베이지안(Bayesian)
- 확률: 선택된 표본이 특정한 사건에 속한다는 가설, 명제, 혹은 주장의 신뢰도(반복이라는 개념을 사용되지 않음)

연습문제

6.2.1
1. \[\Omega_3 = \{HH, HT, TH, TT\}\]
2. \[\Omega_4 = \{1, 2, \cdots, 30, 31 \}\]
6.2.2
- \[\Omega_7 = \{ x: 0 \leq x \leq 359 \}\]
- 표본 개수는 무한대이다.
6.2.3
- 동전을 던졌을 때 나오는 면
- 10개의 돌을 무작위로 잡았을 때 잡힌 돌의 갯수
- 1과 2 사이의 무작위로 고른 실수
- 펜을 돌렸을 때 시작점과 이루는 각도

6.2.4

  A = frozenset(['H'])
  B = frozenset(['T'])
  set([A, B])

  A = frozenset(['HH'])
  B = frozenset(['HT'])
  C = frozenset(['TH'])
  D = frozenset(['TT'])
  set([A, B, C, D])

6.2.5

 P = {A: 0.5, B: 0.5}
 P
        
 >>>
 {frozenset(): 0.5,
  frozenset({'H'}): 0.5}

 P = {A: 0.25, B: 0.25, C: 0.25, D: 0.25}
 P
        
 >>>
 {frozenset('HH'): 0.25,
  frozenset({'HT'}): 0.25,
  frozenset({'TH'}): 0.25,
  frozenset({'TT'}): 0.25}}

6.2.6

 A = frozenset(['1'])
 B = frozenset(['2'])
 C = frozenset(['3'])
 D = frozenset(['4'])
 E = frozenset(['5'])
 F = frozenset(['6'])
 set([A, B, C, D, E, F])
        
 P = {A: 0.5, B: 0.2, C: 0.1, D: 0.1, E: 0.1, F: 0}
 print(P)
            
 >>>
 {frozenset({'1'}): 0.5, frozenset({'2'}): 0.2, frozenset({'3'}): 0.1, frozenset({'4'}): 0.1, frozenset({'5'}): 0.1, frozenset({'6'}): 0}

6.2.7
1. \[P(A) = {P(\{31\}) \over P(\Omega)} = {1 \over 31}\]
2. \[P(\{A\}) = {P(\{A\}) \over P(\Omega)}, P(\{O\}) = {P(\{O\}) \over P(\Omega)}\]
3. \[P(\{A\}) = {70 \over 100}, P(\{O\}) = {30 \over 100}\]

이 글은 ‘데이터 사이언스 스쿨 수학편’을 정리한 것입니다. 질문이나 오류가 있다면 댓글 남겨주세요.