Review
참고 포스팅 :
2023.07.07 - [Statistics/Mathematical Statistics] - [수리통계학] 확률집합함수(Probability Set Function)
# 해당 포스팅은 KOCW 김충락 교수님의 수리통계학 강의와 Hogg의 수리통계학개론(Introduction to Mathematical Statistics)를 기초로 작성되었습니다.
안녕하십니까, 간토끼입니다.
지난 포스팅에서는 확률집합함수(Probability Function)를 정의하면서 확률의 공리를 다뤄봤는데요.
이번 포스팅에서는 이를 확장하여 확률의 성질을 다루고, 나아가 포함-배제 원리(Inclusion-Exclusion Principle)에 대해 다뤄보겠습니다.
잠깐 지난 포스팅에서 다루었던 확률집합함수를 다시 보고 넘어가겠습니다.
확률의 3가지 공리(Non-negativity, Normality, Countable Additivity)를 만족하는 실함수에 대하여 확률집합함수를 정의할 수 있었죠.
이를 바탕으로 확률의 성질을 유도해봅시다.
1. 사건 $A$ 의 확률 $P(A)$ 은 전체 확률 $P(C) = 1$ 에서 $A$ 의 여사건의 확률 $P(A^{C})$ 을 뺀 것과 같다.
$$ P(A) = 1 - P(A^{C}),\,\, \forall \,\, A \in B $$
2. 공집합의 확률은 0이다.
$$ P(\varnothing) = 0 $$
1번째 성질은 지난 포스팅의 마지막에서 다루었으니 생략하겠습니다.
2번째 성질은 간단하게 보일 수 있죠.
위와 같이 사건 A를 공집합으로 가정하였을 때, 여사건은 Sample Space가 되겠죠.
그러면 공집합의 확률은 1에서 여사건의 확률(1)을 뺀 값이 되니 0이 됨을 쉽게 보일 수 있습니다.
$$ Let \,\, A = \varnothing, \,\, Then \,\, A^{C} = C $$
$$ \therefore \,\, By \,\, (1), \,\,\, P(\varnothing) = 1 - P(A^{C}) = 1 - P(C) = 0 $$
3. 사건 $A$ 가 $B$ 의 부분집합이라면, $A$ 의 확률은 $B$ 의 확률과 같거나 작다.
$$ Let \,\, A \subset B, \,\, Then \,\, P(A) \leq P(B) $$
4. 사건 $A$ 가 사건의 모임(sigma-field)에 정의된 사건이라면 $A$ 의 확률은 0과 1 사이의 값을 갖는다.
$$ \forall \,\, A \in B, \,\, P(A) \in [0,1] $$
3번째 성질도 어렵지 않습니다.
사건 A는 B의 부분집합이므로, 사건 B는 A를 포함한 식으로 표현할 수 있습니다.
위 식에 확률집합함수의 정의 중 3번째 공리(Countable Additivity)를 이용한다면 P(A)가 P(B)보다 작거나 같음을 보일 수 있습니다.
$$ Let \,\, A \subset B, \,\, Then \,\, B = A \cup (B \cap A^{C}) = A \cup (B-A) \,\, and \,\, A \cap (B \cap A^{C}) = \varnothing $$
$$ By \,\, Countable \,\, Additivity, \,\, P(B) = P(A) + P(B \cap A^{C}) \,\, and \,\, P(B \cap A^{C}) \geq 0 $$ $$\therefore\,\, P(A) \leq P(B) $$
4번째 성질은 어찌 보면 자명할 수도 있겠네요. 직관적으로 이해하실 수 있을 거라고 생각합니다.
5. 사건 A, B가 Sample Space 상의 사건이면, A, B의 합집합의 확률은 각 사건의 확률을 합한 것에 교집합의 확률을 뺀 것과 같다.
$$ \forall \,\, A, B \in C, \, P(A \cup B) = P(A) + P(B) - P(A \cap B) $$
직관적으로 이해되시겠지만, 위와 같이 성질이 성립함을 보일 수 있습니다.
먼저 A와 B의 합집합, 사건 B를 교집합이 없는 집합의 합집합으로 보일 수 있습니다.
$$ A \cup B = A \cup (B \cup A^{C}), \,\, B = (A\cap B)\cup(B\cap A^{C}) $$
그렇다면 disjoint한 사건 간에는 합집합의 확률이 각 사건의 확률의 합으로 나타낼 수 있는데요.
$$ \forall \,\, m \neq n, \,\, if \,\, A_{m} \cap A_{n} = \varnothing \,\, Then\,\, P(A_{m} \cup A_{n} ) = P(A_{m}) + P(A_{n}) $$
그러므로 A∪B와 B를 구성하는 사건들도 합으로 표현할 수 있습니다. 식에 교집합이 없으니깐요.
$$ P(A\cup B) = P(A) + P(B \cap A^{C} \,\, and \,\, P(B) = P(A\cap B) + P(B\cap A^{C}) $$
이때 P(A∪B)와 P(B)의 공통 성분인 $P(B \cap A^{C})$ 을 이용해 식을 정리하면 위와 같음을 보일 수 있습니다.
$$ P(A \cup B) = P(A) +[ P(B) - P(A \cap B) ], \,\, \because\,\, P(B \cap A^{C} ) = P(B) - P(A \cap B) $$
여기서 5번째 성질인 5. 사건 A, B가 Sample Space 상의 사건이면, A, B의 합집합의 확률은 각 사건의 확률을 합한 것에 교집합의 확률을 뺀 것과 같다. 을 확장해보겠습니다.
만약 사건 A, B가 아닌 3개 A, B, C, 혹은 4개, 5개, 그 이상이 존재할 경우 이때의 합집합의 확률은 어떻게 정의할 수 있을까요?
3개까진 벤다이어그램을 통해 직관적으로 이해할 수 있겠으나, 4개 이상이 되면 생각보다 이해하기 어려울 것 같습니다.
그래서 우리는 포함-배제 원리(Inclusion-Exclusion Principle)를 통해 이를 쉽게 계산할 수 있습니다.
직관적으로 이해할 수 있도록 집합이 3개인 경우에 대해서 합집합을 계산해보죠.
사건 $A, B, C$ 3개가 존재한다고 할 때, 이때의 합집합 $ P(A \cup B \cup C)$ 은 $p_1 - p_2 + p_3$ , 즉 $p_{i}$ 들의 합으로 보일 수 있습니다.
여기서 $p_{i}$ 에 대해서 알아보죠.
먼저 $p_1$ 은 각 사건 자기 자신을 더한 것으로 나타낼 수 있습니다.
$$ p_{1} = P(A) + P(B) + P(C) $$
$p_2$ 는 두 개의 사건만을 이용해 교집합을 구성한 모든 경우의 수의 합으로 보일 수 있습니다.
$$ p_{2} = P(A\cap B) + P(B \cap C) + P(A \cap C) $$
사건이 3개가 있으니, 2개씩 교집합을 구성하면 경우의 수는 3개겠네요.
마지막 $p_{3}$ 는 세 개의 사건을 이용해 교집합을 구성하는데요. 이 경우는 하나밖에 없겠네요.
$$ p_{3} = P(A \cup B \cup C) $$
따라서 위 벤다이어그램을 보시면 이해가 되시겠지만,
먼저 각 사건을 모두 더하고($p_1$), 두 사건의 교집합들을 빼주고($p_2$), 세 사건의 교집합이 1번 더 빼졌으니 이를 한 번 더해주면($p_3$) 세 사건 A,B,C의 합집합의 확률을 정의할 수 있습니다.
$$ P(A \cup B \cup C) = p_{1} + p_{2} + p_{3} $$
$$ \,\,\,\,\,\,\,\,\,\,\,\,\,= [P(A) + P(B) + P(C)] - [P(A \cap B) + P(B \cap C) + P(A \cap C)] + P(A\cap B\cap C) $$
이를 일반적으로 확장하면 다음과 같이 쓸 수 있는데요.
일반항은 $(-1)^{k-1} * p_{k}$ 입니다.만약 사건이 4개(k=4)라면 다음과 같이 합집합을 구할 수 있겠네요.
$$ P(A \cup B\cup C\cup D ) = p_{1} - p_{2} + p_{3} - p_{4} $$
쉽죠?
다음 포스팅에서는 불의 부등식(Boole's Inequality)에 대해 다뤄보겠습니다.
감사합니다.
잘 읽으셨다면 게시글 하단에 ♡(좋아요) 눌러주시면 감사하겠습니다 :)
(구독이면 더욱 좋습니다 ^_^)
* 본 블로그는 학부생이 운영하는 블로그입니다.
따라서 포스팅에 학문적 오류가 있을 수 있으며, 이를 감안해서 봐주시면 감사하겠습니다.
- 간토끼(DataLabbit)
- B.A. in Economics, Data Science at University of Seoul
'Statistics > Mathematical Statistics' 카테고리의 다른 글
[수리통계학] 확률변수(Random Variable ; R.V.) (2) | 2023.09.14 |
---|---|
[수리통계학] 조건부 확률과 베이즈 정리(Conditional Probability and Bayes Theorem) (0) | 2023.07.22 |
[수리통계학] 불의 부등식(Boole's Inequality) (0) | 2023.07.21 |
[수리통계학] 확률집합함수(Probability Set Function) (0) | 2023.07.07 |
[수리통계학] 집합 이론과 시그마 필드(Set Theory and Sigma-Field) (0) | 2023.07.04 |