728x90

Review
참고 포스팅 : 
2020/10/22 - [Statistics/Econometrics] - [계량경제학] 함수 형태의 설정 오류 문제(Functional Form Misspecification)

[계량경제학] 함수 형태의 설정 오류 문제(Functional Form Misspecification)

안녕하십니까, 간토끼입니다. 이번 카테고리 Econometrics에서는 계량경제학에 관한 여러 주제들을 다뤄볼 예정입니다. 다만 계량경제학의 앞부분보다는 뒷부분의 Topic들을 주로 다뤄볼 예정인데

datalabbit.tistory.com


안녕하십니까, 간토끼입니다.
 
지난 포스팅에서 함수 형태의 설정 오류 문제에 관해 다루어보았습니다.
결론만 말하자면, True Model에서의 형태와 같지 않은 변수를 넣어 모형을 추정할 경우, 문제가 발생한다는 것이었죠.
바로 OLS추정량이 Bias(편향)을 갖게 되는 문제였습니다.
 
그러므로 모형을 적절하게 설정하여 추정해야 하는데, 아쉽게도 설명변수 X와 반응변수 Y가 선형 관계일지, 비선형 관계일지 아는 것은 다소 어렵습니다.
(알면 애초부터 잘했겠죠? ㅎㅎ)
 
이때 X와 Y 간 비선형 관계를 갖는지 알려주는 기법 중 하나인 Ramsey의 RESET test에 대해서 다뤄보겠습니다.


램지(Ramsey)의 RESET test에서 RESET은 초기화하는 리셋이 아닙니다.(농담인 거 아시죠?)
Regression Equation Specification Error Test 의 약자로, RESET 이라 합니다.
즉 회귀모형(회귀방정식)의 모형 설정 오류를 탐지해주는 기법 중 하나이죠.
(애초에 'RESET' 안에 Test가 있는데 왜 또 Test를 붙여서 RESET test라고 할까요..? 역전앞과 같은 맥락...?)
 
 
각설하고 다음과 같은 단순회귀모형을 가정해보겠습니다.

 이 단순회귀모형은 Gauss-Markov Assumptions 을 만족할 것이라고 가정하겠습니다.
그러므로 현 시점에서 위 회귀모형은 흠 잡을 데 없는 모형이죠.
 

이때 RESET test우리가 참(True)이라고 생각하는 모형에 Non-linear Term(비선형 항)을 넣어 X와 Y 간 어떠한 비선형 관계가 있는지 파악하는 기법을 말합니다.
여기서 우리는 Non-linear term을 Polynomial 항으로 한정지어 생각해보겠습니다.
 
 

즉 y의 fitted value를 생각해보면, 이 fitted value인 y^의 제곱항을 모형에 집어넣은 후 추정해보자는 거죠.
이때 이 y^의 제곱항은 설명변수 X의 제곱 또한 의미하겠죠?
 
만약 Gauss-Markov Assumptions을 만족한다면 위 제곱항의 회귀계수 δ는 유의하지 않을 것입니다.
그렇다면 y^의 제곱항이 위 모형에서 필요가 없다는 뜻이므로, 다른 말로 하면 설명변수 X의 제곱 또한 필요가 없다는 뜻이겠죠.
설명변수 X와 반응변수 Y 간 유의한 비선형 관계가 탐지되지 않는 것으로 생각해볼 수 있습니다.
 

그러나 회귀계수 δ가 0이 아니고, 이러한 결과가 통계적으로 유의하여 귀무가설을 기각한다면 어떻게 될까요?
설명변수 X와 반응변수 Y 간 유의한 비선형 관계가 존재한다고 이해할 수 있습니다.
 
우리가 기존에 세운 True Model에는 모형 설정 오류(Misspecification)을 갖고 있다는 것이죠.
그래서 우리는 이러한 비선형 관계를 고려하여 모형을 다시 세워야 합니다.
 
 
그렇다면 이어서 다중회귀모형에서의 경우도 생각해보죠.

사실 매커니즘은 같습니다.
결국은 y의 fitted value인 y^의 제곱, 혹은 세제곱 항 등 Polynomial Term을 넣었을 때, 이 term의 회귀계수가 통계적으로 유의한지, 아닌지 살펴보면 됩니다.
 

예를 들어 제곱항, 그리고 세제곱항만 넣어서 테스트해보죠.
이때의 RESET Test에서 귀무가설 H0 : δ_(1) = 0, δ_(2) = 0이며, 이를 따져보기 위해 F-Test를 해야합니다.
Jointly Significant한지 따져봐야 합니다.
(이론상으로 k제곱항(k ≥ 2)까지 넣을 수 있으나, 너무 복잡한 제곱항을 넣을 경우 Overfitting이 발생할 가능성이 크므로 통상적으로 많이 넣어야 세제곱항이라고 합니다. ) 
 

마찬가지로 귀무가설 H0를 기각할 경우, 이는 어떠한 j번째 변수의 Polynomial Term이 통계적으로 유의하다는 것을 의미합니다.
따라서 단순회귀분석의 경우와 같이 True Model이라고 생각했던 초기 모형에 Misspecification이 존재함을 알 수 있습니다.
 
 
다만 RESET Test의 한계가 있습니다. 어떤 걸까요?

바로 이 Non-linear 관계가 정확히 어떠한 Non-linear 관계인지 알 수 없습니다.
즉 로그 관계일 수도 있고, p번째 제곱항일 수도 있고... 이 p가 2일지, 3일지, 혹은 네제곱항 이상일지는 모른다는 것이죠.
그래도 회귀모형의 misspecification이 존재하는 것을 찾아낼 수 있다는 의의가 있습니다.
 
 
다음 포스팅에서는 이러한 모형 설정 오류를 탐지하는 또 다른 기법을 알아보도록 하겠습니다.
 
감사합니다.
잘 읽으셨다면 게시글 하단에 ♡(좋아요) 눌러주시면 감사하겠습니다 :)
(구독이면 더욱 좋습니다 ^_^)
 
 
 


- 간토끼(DataLabbit)
- University of Seoul
- Economics, Data Science

728x90

+ Recent posts