728x90

안녕하십니까, 간토끼입니다.

이번 포스팅은 시계열 분석에서 매우 중요한 성질 중 하나인 Stationarity(안정성)에 대해 다뤄보도록 하겠습니다.


 

 

 


 

 


Stationary Process란?

이전 포스팅에서 종종 언급한 적이 있었습니다.
우리가 시계열 회귀분석을 하기 위해서는 Stationary Process가 돼야만 OLS를 할 수 있다고 했었죠.

물론 이때의 OLS추정량이 불편추정량인지, 혹은 일치추정량인지 등등의 논의는 기타 가정을 좀 더 따져봐야 합니다만... 우선 불편추정량에 대한 논의는 지난 포스팅에서 Time Series에서의 Gauss-Markov Assumptions 을 다루면서 언급했었습니다.

2021.04.10 - [Statistics/Econometrics] - [계량경제학] 시계열 회귀분석의 고전적 가정(1)

[계량경제학] 시계열 회귀분석의 고전적 가정(1)

Review 참고 포스팅 : 2020.12.18 - [Statistics/Econometrics] - [계량경제학] 시계열 회귀분석(Time Series Regression)의 개념 [계량경제학] 시계열 회귀분석(Time Series Regression)의 개념 안녕하십니까, 간..

datalabbit.tistory.com




 

 

아무튼 이 Stationarity(안정성)은 시계열 자료에서 중요한 역할을 합니다.

크게는 강정상성과 약정상성으로 구분할 수 있습니다.

하나씩 살펴보시죠.

 

 










1. Strict Stationary

 

 


만약 어떠한 시계열 변수(Stochastic Process)의 분포가 각 시점 t에서 h만큼 이동한 분포와 같다면 이를 Strictly Stationary Process 라고 합니다.

좀 직관적인 개념은 아닙니다.

쉬운 예시를 한번 보시죠.


 

 


대충 이러한 느낌입니다.

변수들 간의 결합분포(Joint Distribution)을 정의할 때, 이 결합분포는 시점 t에 의존하지 않고 시차(lag)인 h에 따라 갖게 정의됩니다.

일례로 위에서 보는 것처럼 X0, X1의 결합분포는 2-시차만큼 떨어진 X2, X3과의 결합분포와 동일하게 정의됨을 알 수 있죠.


설명만 들어도 아시겠지만 이 가정은 매우 강력한 가정입니다.

사실 이론적인 가정이라고도 볼 수 있습니다. 비교적 실용성이 떨어진다는 거죠.

 

 


만약 어떤 변수들이 Stationary하다고 해도 이 두 변수의 상관관계가 존재하지 않는다는 의미는 아닙니다.

이 상관성에 대한 논의는 다음 포스팅에서 다뤄보도록 하죠.

또한 임의의 변수가 Stationary하고, Finite Second Moment를 갖는다면 Covariance 또한 위와 같이 시차 h만큼 떨어진 변수들 간 같다고 정의할 수 있습니다.


아무튼 이 Strict Stationary 가정은 다소 비현실적인 가정이라고 했습니다.

그렇다면 조금 완화된 현실적인 가정을 살펴보도록 하죠.





2. Weakly Stationary(Covariance Stationary)

 

 


만약 임의의 Stochastic Process가 Finite Second Moment를 갖고,
이 변수의 기댓값과 분산이 특정 시점 t에 의존하지 않는 상수이며,
공분산 또한 시점 t가 아닌 시차 h에 의존하여 정의된다면, 위 Stochastic Process는 Weakly Stationary Process라고 합니다.

위에서 다루었던 Strictly Stationary와 다르게 분포(Distribution)에 대한 언급은 없죠.




재밌는(?) 사실은 만약 강정상성(Strict Stationary Process)을 갖는 변수가 Finite Second Moment를 갖는다면, 이 변수는 Covariance Stationary도 만족합니다.

한번 가볍게 보시죠.

If a stationary process has a finite second moment, then it must be covariance stationary.

 

 



둘은 별개의 가정이지만, 어떻게 보면 Strict Stationary가 더 상위의 개념이라고 볼 수 있겠습니다.

왜냐하면 위 명제의 역은 성립하지 않거든요.




 

 


위에서 언급했다시피 Strict Statioary는 너무 강력한 가정입니다.

따라서 실제 시계열 분석에서는 실용적인 가정인 Weakly Stationary 가정만 만족해도 충분하다고 합니다.


한번 Weakly Stationary를 따르는 변수의 시계열 그림을 한번 보시죠.

 

 

대충 이런 느낌입니다.

어떠한 추세나 계절성(Seasonality)을 보이지 않고, 분산 또한 일정함을 알 수 있죠.

실제로는 눈으로 확인하는 것이 아닌 다른 통계적 test를 이용해 정상성을 갖는 Process인지 따져봐야 하긴 합니다.


 

 

만약 시계열 변수가 Linear trend나 Seasonlity를 갖는다면 위와 같이 비정상적인 Process의 모습을 보입니다.

기댓값 또한 특정 시점에 의존하는 모습을 보이고, 시간이 흐름에 따라 이분산성이 나타남을 알 수 있죠.


물론 유감스럽게도 실제 시계열 자료의 대부분은 Non Stationary Process입니다.

그래서 Stationary Process로 바꿔주는 작업이 필요합니다.

이 부분은 추후 다뤄보도록 하죠.




다음 포스팅은 중요한 가정 중 하나인 Weakly Dependent에 대해 다뤄보도록 하겠습니다.

감사합니다.

잘 읽으셨다면 게시글 하단에 ♡(좋아요) 눌러주시면 감사하겠습니다 :)

(구독이면 더욱 좋습니다 ^_^)

 

 

 

 


- 간토끼(DataLabbit)

- University of Seoul

- Economics & Data Science

 

728x90

+ Recent posts