728x90

Review

참고 포스팅 : 2020/05/18 - [Statistics/Basic Statistics] - [기초통계학] 확률변수와 기댓값, 분산

 

[기초통계학] 확률변수와 기댓값, 분산

Review 참고 포스팅 : 2020/05/15 - [Statistics/Basic Statistics] - [기초통계학] 기술통계학(Descriptive Statistics)기초 2 - 모집단과 표본집단 with 모수&통계량 [기초통계학] 기술통계학(Descriptive Stati..

datalabbit.tistory.com


안녕하십니까, 간토끼입니다.

 

이전 포스팅에서 확률변수의 개념과 이를 이용해 기댓값과 분산의 정의를 살펴보았습니다.

 

(뭔가 순서가 바뀐 것 같지만) 확률변수를 언급했으니, 확률에 대해서 정의해야겠죠?

 

다만 확률론에서 다루는 것처럼, 보다 엄밀한 정의를 사용하는 것보다는,

기초통계학 수준에서 이해할 수 있을 정도로만 짚고 넘어가겠습니다.

(사실 확률론을 못 배워서 ... 기회가 되면 공부해보고 작성할게요. 매운맛을 원하신 분들에게는 죄송)

 

매번 발로 쓴 글씨 죄송합니다.

 

1. 확률(Probability)

확률이란 무엇일까요. 우리가 주변에서 참 많이 사용하는 용어 중 하나입니다.

대체로 확률이란 용어를 사용하는 상황을 생각해보면 어떠한 일이 발생할 가능성에 대해 논할 때 확률을 사용하는 것 같습니다.

예를 들어 가위바위보를 할 때 내가 질 확률을 떠올리거나,

행운권 추첨에 응모하며 '이쯤 되면 나오겠지...? 대충 10번 했으니까... 나올 때가 됐다...' 이런 상황에서도 확률을 떠올리죠.

 

이처럼 확률은 큰 틀 안에서 상황에 따라 약간씩 의미가 다르게 규정되는 것 같습니다.

위 가위바위보 예시는 모든 경우의 수를 계산하여 그중 내가 질 경우가  어느정도 되는지를 살펴보는 것이고,

행운권 추첨의 경우, 내가 응모에 참여한 횟수와 당첨과 꽝의 비율이 어느정도 되는지를 골고루 살펴보면서 생각해본다는 거죠.

 

이처럼 확률은 크게 주관적 확률(Subjective Probability)객관적 확률(Objective Probability)로 구분할 수 있습니다.

 

주관적 확률이란 의사결정자가 자신의 지식이나 경험에 의거하여 주관적으로 어떤 사건(Event)가 일어날 가능성에 부여한 일정한 값을 의미합니다.

예를 들어 위 행운권 추첨처럼, "내가 n번 해봤는데 A처럼 할 경우 당첨될 확률이 10%더라" 등 개인의 경험에 기반한다는 거죠.

혹은 경제 전문가가 '향후 경제 2년 이내 경제 위기가 발생할 확률이 20%'라고 하는 것도 주관적 확률입니다.

 

주관적 확률은 개인의 경험에 바탕을 둔, 말 그대로 주관적이기에 소위 말하는 뇌피셜(?)이라는 생각이 들 수도 있습니다.

그러나 이 개인의 판단에 새로운 정보가 지속적으로 들어옴으로써 판단이 Update되고, 정확도를 개선해나간다면 주관적 확률이 오히려 획기적인 지표가 될 수도 있습니다.

이러한 아이디어에 바탕을 두고 만들어진 통계학을 베이즈 통계학(Bayesian Statistics)라고 합니다. 이 통계학은 베이즈 정리(Bayes' Theorem)에 기반을 두고 있는데요. 요 베이즈 정리는 조만간 포스팅에서 다룰 예정입니다.

 

그리고 객관적 확률이란 어떤 사건이 발생할 가능성을 사전적으로 판단하여 얻는 확률인 고전적 확률과, 사후적으로 많은 실험을 반복하여 어떤 사건이 발생할 상대도수를 관찰하여 얻는 통계적 확률로 구분할 수 있습니다.

이후 다룰 확률은 이 객관적 확률을 중심으로 소개될 예정입니다.

 

2. 확률을 다루기 위한 몇 가지 기본 개념

(1) 확률실험(Random Experiment)

- 실험을 시행하기 전에 발생할 모든 결과를 알 수 있으나, 각각의 결과가 발생할 가능성에 대해서는 확실히 예측하기 어려운 실험

(2) 표본공간(Sample Space)

- 확률실험에서 발생 기능한 모든 결과(Ω)

- 만약 표본공간의 원소가 유한개인 경우는 유한표본공간, 무한개인 경우는 무한표본공간

(3) 사건(Event)

- 표본공간의 부분집합, 즉 관심을 갖는 실험의 결과

(4) 근원사건(Elementary Event)

- 사건 가운데 하나의 원소로 이루어진 사건

- 근원사건 전체의 집합을 표본공간으로도 정의함.

 


(A) 고전적 확률

 

 

고전적 확률의 정의는 다음과 같습니다.

n개의 원소를 가진 표본공간을 정의하였을 때, 각 근원사건 w가 일어날 가능성이 1/n으로 동일하다면

k개의 원소(근원사건)으로 구성된 사건 A의 확률인 P(A)는 k를 원소의 개수 n으로 나눈 값을 의미합니다.

 

예를 들어 동전을 한번 던지는 사건을 정의할 때 앞면을 H, 뒷면을 T라고 하면 이는 각각의 근원사건이며,

표본공간 Ω = { H, T }  이라고 정의할 수 있습니다.

그러므로 위 고전적 확률의 정의에 의해, 각각의 확률은 1/2, 1/2 라고 할 수 있죠.

 

사실 동전을 던지지 않고도 우린 앞면, 혹은 뒷면이 나올 확률이 1/2임을 잘 알고 있지만,

이를 알고 있는 이유는 암묵적으로 두 가지 가정에 기반하여 사고하기 때문입니다.

(1) 각각의 근원사건은 발생 가능성이 동일하다.

(2) 각각의 근원사건은 상호 배반(Mutually Exclusive)이다.

* 상호 배반 : 각각의 사건이 서로 동시에 발생할 수 없음.

 

(B) 통계적 확률

 

 

크게 설명할 필요가 없을 정도로 단순한 개념이죠? 단 N이 충분히 큰 수라고 가정하고 있습니다.

이 확률의 특징은 모집단이 무엇인지 가정하지 않고(알지 못하고), 무수히 많은 반복실험(N번)을 하여 얻은 표본을 이용해 모집단의 특성을 파악하려는 접근방식입니다.

위 동전 던지기의 경우, 처음엔 정확히 1/2가 아닐 수 있으나, 무수히 많이 반복하다보면 1/2로 수렴하게 됩니다.

 

(C) 공리적 확률

 

 

공리적 확률은 몇 가지 기본적인 공리를 바탕으로 확률을 정의한 것입니다. 어렵지는 않은데요.

표본공간 Ω에서의 임의의 사건 A에 대하여 A의 확률 P(A)가 0과 1사이의 범위를 만족하고,

P(Ω) = 1을 만족하며 배반인 사건에 대해서도 합집합의 연산이 위와 같이 성립할 경우 P(A)를 사건 A의 확률이라고 정의합니다.

 

위 공리적 확룰을 바탕으로 다음과 같은 정리를 유도할 수 있습니다. 일종의 집합 연산이죠?

 

 

물론 유도과정도 별로 어렵진 않습니다. 다 고등학교 때 배우잖아요?

 

 

 

어쩌다보니 내용이 좀 길어졌네요.

 

다음 포스팅에서는 결합확률, 주변확률, 조건부확률에 대해서 다뤄보고, 이후 포스팅에서는 이를 이용해 베이즈정리에 대해서 다뤄보겠습니다.

후후 슬슬 포스팅이 재밌어지는군요.

 

만든지 1주일 됐는데 생각보다 많은 분들이 찾아주셔서 놀랍기도 하고, 기뻐서 어떤 걸 더 올리면 좋을까 고민도 되고..

이래저래 행복한 오늘입니다. 봐주셔서 감사해요.

 

 

감사합니다.

잘 읽으셨다면 게시글 하단에 ♡(좋아요) 눌러주시면 감사하겠습니다 :)

(구독이면 더욱 좋습니다 ^_^)

 


- 간토끼(DataLabbit)

- University of Seoul

- Economics, Big Data Analytics

728x90

+ Recent posts