Review
# 해당 포스팅은 KOCW 김충락 교수님의 수리통계학 강의와 Hogg의 수리통계학개론(Introduction to Mathematical Statistics)를 기초로 작성되었습니다.
안녕하십니까, 간토끼입니다.
장교로 군 복무를 마치고 오랜만에 돌아왔습니다.
학부 수업으로 배운 적이 없어서 대학원 진학 전 제대로 공부도 할 겸 꼭 한번은 다뤄보고 싶었던 수리통계학(Mathematical Statistics)을 이번 시리즈를 통해 다뤄보겠습니다.
이번 포스팅에서는 수리통계학을 본격적으로 다루기 전에 기초가 되는 집합 이론과 시그마 필드(Set Theory and Sigma Field)에 대해 다뤄보겠습니다.
여러 가지 연구는 본질적으로 동일한 조건에서의 반복 실험이 주가 되곤 하죠.
예를 들어 의학 연구에서는 어떤 A라는 질병을 치료하기 위한 약을 개발한다고 하면, 복용한 약의 효과에 관심이 있을 겁니다.
연구자가 이와 같은 정보(위 예시에서는 약의 효과)를 이끌어내기 위해서는 실험을 해야 합니다.
즉 어떤 현상으로부터 결과를 이끌어내기 위해서는 실험(Experiment)을 해야하고, 실험을 통해 우리는 실현값(Outcome)을 얻어낼 수 있습니다.
다만 어떠한 실현값이 나올지는 실험을 하지 않고는 알 수 없죠. 물론 '예측'은 해볼 수 있지만 어디까지나 예측일뿐 정확한 값은 아니니깐요.
실현값을 정확히 예측할 수 없는 한 가지 실험을 생각해봅시다.
우리는 한 번의 실험을 통해 어떠한 값이 나올지 정확히 예측할 수는 없지만, 어떤 실현값이 나올지 알 수 있고, 이러한 실현값의 집합을 사전에 기술할 수 있다고 가정합시다.
이를 동일한 조건에서 반복할 수 있다면 이 실험은 확률 실험(Random Experiment)이라고 합니다.
그리고 이때 가능한 모든 실현값의 집합을 표본공간(Sample Space)이라고 하며, 기호로는 $C$ 라고 하겠습니다.
이때 $C$ 의 부분집합은 사건(Event)이라고 합니다.
예를 들어 동전을 던지는 상황을 가정하면, 동전 던지기는 확률 실험이 되겠고, 표본 공간 $C$ = {앞, 뒤}가 되겠죠.
그리고 앞면이 나오거나 뒷면이 나오는 등 각 부분집합은 이 표본공간의 사건이 됩니다.
위 본문에서 자주 등장한 표현이 있습니다. 바로 집합이죠.
집합의 기본 대수학은 확률론에서 매우 유용하게 사용됩니다.
이를 위해 중학교 때 배운 거지만 집합의 간단한 개념을 짚고 넘어갑시다.
설명을 위해 벤다이어그램을 사용하겠습니다.
표본 공간 $C$ 의 부분집합인 사건 $A$ 를 정의한다면, 이를 좌측 상단과 같이 도식할 수 있습니다.
그리고 집합 $B$ 의 각 원소가 또한 집합 $A$ 의 원소이면 $B$ 를 $A$ 의 부분집합(Subset)이라고 하고, 이는 $B \subset A$ 라고 표기할 수 있습니다.
사건 $A$ 와 사건 $B$ 의 합집합(Union)은 $A$ 에 있거나, $B$ 에 있거나, $A$ 와 $B$ 모두에 있는 원소의 집합입니다. 이는 $A \cup B$ 라고 합니다.
사건 $A$ 와 사건 $B$ 의 교집합(Intersection)은 $A$ 와 $B$ 모두에 있는 원소의 집합입니다. 이는 $ A \cap B$ 라고 합니다.
만약 $A$ 와 $B$ 의 교집합이 공집합(원소가 없는 사건)이라면, $A$ 와 $B$ 는 배반(Disjoint)의 관계에 있다고 합니다.
이때 $A \cup B$ 는 배반인 합집합(Disjoint Union)을 형성합니다.
예를 들어 동전을 던질 때 앞면이 나오는 사건과 뒷면이 나오는 사건은 동시에 발생할 수 없죠?
그렇다면 사건 A를 앞면이, B를 뒷면이 나오는 사건이라고 한다면, 이 두 집합은 교집합이 공집합인 배반 관계입니다.
이번엔 합집합과 교집합의 개념을 좀 더 확장해보겠습니다.
만약 집합이 유한하거나 자연수의 개수만큼 많은 원소를 가지고 있을 때, 이를 셀 수 있는 가산형(Countable) 집합이라고 합니다.
이때 n개의 집합 $ A_{1} , A_{2} , \cdots , A_{n} $ 이 있다면 이 집합열의 합집합과 교집합은 위와 같은 notation을 쓸 수 있습니다.
$$ \bigcup_{i=1}^{n} A_{i} := A_{1} \cup A_{2} \cup \cdots \cup A_{n} $$
$$ \bigcap_{i=1}^{n} A_{i} := A_{1} \cap A_{2} \cap \cdots \cap A_{n} $$
단조(Monotone) 집합열에 대해서도 다뤄보죠.
단조(Monotone)란 함수나 수열이 증가하거나 감소하는 성질, 또는 그러한 함수나 수열을 말합니다.
만약 임의의 양수 $n$ 에 대하여 $A_{n} \subset A_{n+1}$ 의 관계가 항상 성립한다면 이때 집합열 $ {A_{n} } $ 은 비감소(Non decreasing) 집합열이라고 합니다.
반대로 임의의 양수 $n$ 에 대하여 $A_{n} \supset A_{n+1}$ 의 관계가 항상 성립한다면 이때 집합열 ${A_{n} } $은 비증가(Non increasing) 집합열이라고 합니다.
그리고 이때 $A_{n}$ 이 비감소 집합열이라면 (1)의 관계가, $A_{n}$ 가 비증가 집합열이라면 (2)의 관계가 정의될 수 있습니다.
$$ \lim_{n \to \infty} A_{n} = \bigcup_{n=1}^{\infty} A_{n} \,\,\, \cdots \,\,\, (1) $$
$$ \lim_{n \to \infty} A_{n} = \bigcap_{n=1}^{\infty} A_{n} \,\,\, \cdots \,\,\, (2) $$
예를 들어 $n = 1,2,3, \cdots $ 에 대하여 $A_{n} = [1, 3, 5, \cdots , 2n-1 ] $ 이라는 집합열을 가정하면, 이는 Nondecreasing 집합열입니다.
$A_{1} = {1} $이고, $A_{2} = {1,3} $이므로 $A_{n} \subset A_{n+1}$ 가 성립하죠.
만약 이 집합열에 극한을 취한다면, 이는 모든 집합열 $A_{n}$ 의 합집합과 동일함을 쉽게 생각할 수 있으실 겁니다.
자 그러면 글의 초반으로 다시 돌아가보죠.
우리는 어떤 실험이 주어졌을 때 모든 가능한 결과의 표본공간에 대해 정의했었습니다.
즉 확률 실험의 결과값의 집합인 Sample Space를 생각해본다면,
이 Sample Space의 부분집합인 사건(Event)이 발생할 가능성에도 관심이 있으실 겁니다.
예를 들어 위에서 예시를 들었던 동전 던지는 사건을 보자면, '앞면이 나올 확률', 혹은 '뒷면이 나올 확률'에 관심이 있으실 겁니다. 그쵸? ㅎㅎ
즉 이는 표본공간의 사건(부분집합)의 크기를 정의하는 문제로 생각해볼 수 있습니다.
우리는 이를 위해 측도(Measure)의 개념을 활용해야 합니다.측도(Measure)를 쉬운 예시로 한번 설명해보죠.
만약 컵에 물이 들어있는 상황을 가정해봅시다.
우리는 이 컵에 물이 '얼마나' 들어있는지 궁금해합니다.
이를 측정할 수 있는 방법은 여러가지가 있겠지만, 가장 직관적인 방법은 '물의 부피(Volume)'를 정의하여 계산하는 방법이 있겠죠.
이는 컵에 들어있는 물에 '부피'라는 크기를 부여한 과정이라고 생각해볼 수 있습니다.
다시 말하면 3차원 입체의 집합에 '부피'라는 크기를 부여한 거죠. 이렇게 집합에 '크기'라는 개념을 부여하는 것을 측도라고 합니다.
여기서 확률(Probability)에 대해 얘기해볼 수 있습니다.
확률은 바로 확률실험의 실현값(부분집합인 '사건')에 대한 측도이기 때문이죠.
측도는 단순히 길이나 넓이같은 개념뿐만 아니라 일상적인 상황에도 활용하기 위해 확률론에 도입되었습니다.
과거 연속적인 공간에서 일관성 있게 확률을 정의하는 방식이 없었기 때문에, 확률을 모순없이 정의하기 위해서 측도의 개념을 도입한 것이죠.
즉 확률이라는 측도를 사용하기 위해 측정 대상을 엄밀히 정의하는 과정이 필요한데,
이것이 바로 시그마 필드(σ-field ; sigma-field) 입니다.
집합 $B$ 를 표본공간 $C$ 의 부분집합으로 이루어진 집합으로 정의해봅시다.
이때 집합 $B$ 가 sigma-field가 되기 위해서는 위 3가지 조건이 충족돼야 합니다.
(1) 집합 $B$ 는 공집합 $\varnothing$ 을 원소로 가져야 합니다.
(2) 집합 $B$ 에 속하는 임의의 집합 $c$ 에 대하여 $c$ 의 여집합 $c^{C}$ 역시 $B$ 에 속해야 합니다. 이를 여집합의 연산에 닫혀있다고 합니다.
(3) $C_{1}, C_{2} , \cdots$ 이 집합 $B$ 에 속한다면 이들의 가산형 합집합(Countable Union) 역시 집합 $B$ 에 속해야 합니다. 이를 가산형 합집합 연산에 닫혀있다고 합니다.
가장 쉬운 Sigma Field는 다음과 같습니다.
보시다시피 간단하게 $B$ 가 Sigma field임을 보일 수 있습니다.
이제 표본공간 $C$ 가 있고, 사건의 모임인 Sigma field B를 정의했으므로, 확률공간의 마지막 요소인 확률, 다른 말로 확률집합함수를 정의할 수 있습니다.
다음 포스팅에서는 이 확률집합함수(Probability Set Function)에 대해 다뤄보겠습니다.
감사합니다.
잘 읽으셨다면 게시글 하단에 ♡(좋아요) 눌러주시면 감사하겠습니다 :)
(구독이면 더욱 좋습니다 ^_^)
* 본 블로그는 학부생이 운영하는 블로그입니다.
따라서 포스팅에 학문적 오류가 있을 수 있으며, 이를 감안해서 봐주시면 감사하겠습니다.
- 간토끼(DataLabbit)
- B.A. in Economics, Data Science at University of Seoul
'Statistics > Mathematical Statistics' 카테고리의 다른 글
[수리통계학] 확률변수(Random Variable ; R.V.) (2) | 2023.09.14 |
---|---|
[수리통계학] 조건부 확률과 베이즈 정리(Conditional Probability and Bayes Theorem) (0) | 2023.07.22 |
[수리통계학] 불의 부등식(Boole's Inequality) (0) | 2023.07.21 |
[수리통계학] 확률의 성질과 포함-배제 원리(Inclusion-Exclusion Principle) (0) | 2023.07.19 |
[수리통계학] 확률집합함수(Probability Set Function) (0) | 2023.07.07 |