728x90

Review

참고 포스팅 : 2020/05/20 - [Statistics/Basic Statistics] - [기초통계학] 확률(Probability) 1 - 확률의 기본 개념

 

[기초통계학] 확률(Probability) 1 - 확률의 기본 개념

Review 참고 포스팅 : 2020/05/18 - [Statistics/Basic Statistics] - [기초통계학] 확률변수와 기댓값, 분산 [기초통계학] 확률변수와 기댓값, 분산 Review 참고 포스팅 : 2020/05/15 - [Statistics/Basic Statis..

datalabbit.tistory.com


안녕하십니까, 간토끼입니다.

 

지난 포스팅에서는 확률의 기본 개념에 대해서 다뤄봤습니다.

확률 파트는 지난 포스팅 포함하여 3부작으로 게시할 예정입니다.

 

이번에는 지난 포스팅의 마지막 부분에 있던 공리적 확률을 좀 더 확장하여 얻어낸 개념인

결합확률, 주변확률, 조건부확률에 대해서 다뤄보겠습니다.

 

1. 결합확률(Joint Probability)

결합확률이란 두 개의 사건이 동시에 일어날 확률을 의미합니다.

다르게 설명하면, 서로 배반되는 두 사건 A, B가 있을 때, 두 사건이 동시에 일어나는 확률을 P(A∩B) 라고 하며

이 확률을 A, B의 결합확률이라고 정의합니다.

 

예를 들어 동전을 던지는 실험을 가정합시다.

이때 첫 번째 동전을 던지는 사건을 A, 두 번째 동전을 던지는 사건을 B라고 합시다.

A, B는 동시에 일어날 수 없으므로 상호 배반이라고 할 수 있죠?

A에서 나올 수 있는 경우의 수는 앞, 혹은 뒷면이며 B도 마찬가지입니다. (H : 앞, T : 뒤)

A (X) B (Y)
H H
H T
T H
T T

 각각의 사건이 동시에 발생할 수 있는 경우의 수를 종합해봤습니다. 4개죠?

이때 H = 1, T = 0이라고 수치적으로 변환하고, 이에 따라 A와 B사건을 X, Y라는 확률변수로 변환합시다.

X Y P(X,Y)
1 1 1/4
1 0 1/4
0 1 1/4
0 0 1/4

위 각각의 사건이 나타날 확률은 서로 독립이므로, P(AB)=P(A) · P(B)를 만족합니다.

따라서 각각의 결합확률을 우측 열과 같이 1/4이라고 할 수 있습니다.

 

 

2. 주변확률(Marginal Probability) or 한계확률

주변확률이란 개별 사건의 확률이지만, 결합사건(Joint Event)들의 합으로 표시될 수 있는 확률을 의미합니다.

위 테이블을 바탕으로 새로운 테이블을 만들어보죠.

결합확률과 주변확률을 표현하였습니다.

주변확률은 단어에서도 뜻을 유추할 수 있듯이, 위 확률 변수의 결합분포를 기록한 테이블에서 주변(Margin)에 위치한 확률을 의미합니다.

X = 0으로 고정할 때를 예로 들어보면, P(X=0, Y=0) + P(X=0, Y=1) = P(X=0)가 도출됩니다.

X는 고정되었지만 Y값은 계속 변하는 것을 알 수 있죠?

즉 다시 말해서, 위 확률은 Y=y의 값에 관계없이 X=0인 주변확률(한계확률)이라고 표현할 수 있습니다.

정리하면 주변확률함수는 변수가 이산확률변수냐, 연속확률변수냐에 따라 다음과 같이 표현됩니다.

어렵진 않죠?

 

 

3. 조건부확률(Conditional Probability)

조건부확률이란 특정한 주어진 조건 하에서 어떤 사건이 발생할 확률을 의미합니다.

즉 어떤 사건 A가 일어났다는 전제 하에서 사건 B가 발생할 확률이라고 할 수 있습니다.

 

우리가 지난 포스팅에서 정의한 사건 A의 확률이라는 것의 의미를 다시 생각해봅시다.

N개의 원소가 있는 표본공간 U에서 각 근원사건 w가 일어날 가능성이 동일하다면, k개의 원소로 구성된 사건 A의 확률은 k/N 이라고 정의하였습니다.

즉 확률을 정의할 때 분모에 '표본공간의 원소의 개수'가 들어갔던 것이죠.

 

그러나 조건부확률은 어떠한 사건 A가 일어났다는 전제 하에 확률을 정의하므로,

이때의 표본공간은 A의 근원사건 k개로 이루어진 표본공간으로 재정의됩니다.

 

따라서  어떤 사건 A가 일어났다는 전제 하에서 사건 B가 발생할 확률인 조건부확률을 다음과 같이 정의할 수 있습니다.

P(B|A) = P(A∩B)/P(A)

즉 분자는 A와 B의 결합확률이고, 분모는 사건 A의 확률이 되는 것이죠.

  

이를 도식화하면 다음과 같습니다.

 

4. 결합확률, 주변확률, 조건부확률의 수리적 관계

위에서 소개해드렸던 세 개념이 어떻게 서로 엮여있는지 이걸 보시면 이해가 쉽습니다.

특히 각 마지막 줄에 나와있듯이, 결합확률의 합은 1이 돼야 합니다.

이는 위 결합확률테이블에서 각 결합확률을 더해보시면 1이 됨을 통해 쉽게 확인하실 수 있습니다.

 

사실 중간에 확률질량함수니, 확률밀도함수니, 조건부확률밀도함수니 등의 개념이 나오긴 합니다만 그냥 변수의 유형에 따라 개념의 사용이 약간씩 차이날 뿐 틀 자체는 동일합니다.

 

이번 포스팅에서는 결합확률, 주변확률(한계확률), 조건부확률에 대해서 다뤄봤습니다.

 

다음 포스팅에서는 정말 중요한 개념! 조건부확률을 확장한 베이즈정리에 대해서 다뤄보겠습니다.

 

 

감사합니다.

잘 읽으셨다면 게시글 하단에 ♡(좋아요) 눌러주시면 감사하겠습니다 :)

(구독이면 더욱 좋습니다 ^_^)



 

 

 


- 간토끼(DataLabbit)

- University of Seoul

- Economics, Big Data Analytics

728x90

+ Recent posts