표본공간과 확률표본
- 표본공간(sample space)
- 가능한 모든 확률표본의 집합 (\(\Omega\))
- 확률표본(probabilistic sample, random sample)
- 풀고자 하는 확률적 문제에서 발생할 수 있는 하나의 현상
- 선택될 수 있는 하나의 경우
- = 표본(sample)
- 집합(set): 구별 가능한 객체의 모임 (보통 알파벳 대문자로 표기)
- 원소(element): 집합에 포함된 구별 가능한 객체 (보통 알파벳 소문자로 표기)
- 예시
- \[x \in A\]
- \[x \notin A\]
- \[A = \{1, 2, 3\} \rightarrow 1 \in A, 4 \notin A\]
사건
- 사건
- 표본공간의 부분집합
- 보통 알파벳 대문자로 표기
확률
- 확률(P): 사건을 입력했을 때 확률값이 출력되는 함수
- 정의역(domain): 표본공간의 모든 사건의 집합
- 규칙(Kolmogorov’s axioms)
- \[P(A) \geq 0\]
- \[P(\Omega) = 1\]
- \[A \cap B = \emptyset \rightarrow P(A \cup B) = P(A) + P(B)\]
확률은 표본이 아닌 사건을 입력으로 가지는 함수
- 오류: 확률이 표본 하나 하나에 대해 정의되 있는 숫자 (\(P(1) = {1 \over 6}\))
- 확률은 표본이 아닌 사건에 대해 정의한다 (\(P(\{1\}) = {1 \over 6}\))
주사위 한 면의 확률은 무조건 1/6?
- 콜모코로프의 공리를 따른다면 주사위에 어떤 조작이든 가능하기 때문에 항상 그렇지는 않다.
확률의 의미
- 빈도주의(Frequentist)
- 사건의 확률: 반복적으로 선택된 표본이 사건의 원소가 될 경향
- 베이지안(Bayesian)
- 확률: 선택된 표본이 특정한 사건에 속한다는 가설, 명제, 혹은 주장의 신뢰도(반복이라는 개념을 사용되지 않음)
연습문제
- 6.2.1
- \[\Omega_3 = \{HH, HT, TH, TT\}\]
- \[\Omega_4 = \{1, 2, \cdots, 30, 31 \}\]
- 6.2.2
- \[\Omega_7 = \{ x: 0 \leq x \leq 359 \}\]
- 표본 개수는 무한대이다.
- 6.2.3
- 동전을 던졌을 때 나오는 면
- 10개의 돌을 무작위로 잡았을 때 잡힌 돌의 갯수
- 1과 2 사이의 무작위로 고른 실수
- 펜을 돌렸을 때 시작점과 이루는 각도
- 6.2.4
-
A = frozenset(['H']) B = frozenset(['T']) set([A, B])
-
A = frozenset(['HH']) B = frozenset(['HT']) C = frozenset(['TH']) D = frozenset(['TT']) set([A, B, C, D])
-
- 6.2.5
-
P = {A: 0.5, B: 0.5} P >>> {frozenset(): 0.5, frozenset({'H'}): 0.5}
-
P = {A: 0.25, B: 0.25, C: 0.25, D: 0.25} P >>> {frozenset('HH'): 0.25, frozenset({'HT'}): 0.25, frozenset({'TH'}): 0.25, frozenset({'TT'}): 0.25}}
-
- 6.2.6
-
A = frozenset(['1']) B = frozenset(['2']) C = frozenset(['3']) D = frozenset(['4']) E = frozenset(['5']) F = frozenset(['6']) set([A, B, C, D, E, F]) P = {A: 0.5, B: 0.2, C: 0.1, D: 0.1, E: 0.1, F: 0} print(P) >>> {frozenset({'1'}): 0.5, frozenset({'2'}): 0.2, frozenset({'3'}): 0.1, frozenset({'4'}): 0.1, frozenset({'5'}): 0.1, frozenset({'6'}): 0}
-
- 6.2.7
- \[P(A) = {P(\{31\}) \over P(\Omega)} = {1 \over 31}\]
- \[P(\{A\}) = {P(\{A\}) \over P(\Omega)}, P(\{O\}) = {P(\{O\}) \over P(\Omega)}\]
- \[P(\{A\}) = {70 \over 100}, P(\{O\}) = {30 \over 100}\]
이 글은 ‘데이터 사이언스 스쿨 수학편’을 정리한 것입니다.
질문이나 오류가 있다면 댓글 남겨주세요.