728x90

안녕하십니까, 간토끼입니다.

 

이번 포스팅에서는 2020년에 학부 경제분석캡스톤디자인 수업에서 다룬 프로젝트인 논문 작성 경험에 대해 다뤄보도록 하겠습니다.

 


 

평소 대학원 진학을 고민하던 상황이었기 때문에, 나름대로 논문 작성 경험이 필요했습니다.

특히 이공계열이 아니기 때문에 학부연구생 등 랩 생활을 할 기회가 없던 저로서는 기회를 잡기가 참 어려웠는데요.

그래서 그런 것도 있고, 학부의 마지막을 정립한다는 의미에서 캡스톤디자인 수업은 한번 듣고 졸업해야겠다 생각했었습니다.

 

이러한 상황에서 평소 존경하던 교수님이 캡스톤디자인 수업을 처음으로 개설하셨는데요.

기회다 싶어서 고민도 안하고 수강 신청을 하였습니다.

 

 

1. 대회 소개

경제분석캡스톤디자인 수업은 통상 학부 4학년 학생을 대상으로, 지난 3년간 경제학 전반에 걸쳐 학습한 내용을 토대로 다양한 유형의 경제분석을 실시하며 분석 역량을 개발하는 것을 목적으로 합니다.

특히 흥미로운 점은 담당하시는 교수님에 따라 어느정도 강조하고자 하는 역량이 정해집니다.

예를 들어 미시경제학을 전공하신 교수님이 담당하시는 분반이라면, 노동경제학 / 인구경제학 / 환경경제학 /  도시경제학 등 응용미시계량 분야의 다양한 주제를 논문 주제로 선택하여 계량 분석을 할 수 있습니다.

제가 선택한 분반은 계량경제학을 전공하시는 교수님이 개설하신 분반이었기 때문에, 특정 분야에 좌우되지 않고 제가 원하는 분야를 선택해 계량 분석을 해야 했습니다.

 

특히 학부 계량경제학 수업에서도 엄밀하게 가르치시기로 유명하신 교수님이셨기에, 통계 분석을 제대로 할 수 있을 거라 확신했습니다.

계량분석이라고 하면 통상 회귀분석을 기반으로 이중차분법(DID), 패널 데이터 분석, 시계열 분석 등의 기법을 응용하거나 혹은 단순히 횡단면데이터를 이용한 다중회귀분석을 지칭합니다.

마침 그때 제가 시계열분석에 관심이 생겨서... 평소 학부 수업에서 깊게 다루지 못하는 시계열 데이터를 이용한 통계 기법을 제대로 배워보고 싶은 마음에 교수님 분반을 선택하였습니다.

 

사실 캡스톤디자인만 듣고 논문 쓰기엔 아쉬워서 원래의 목적은 경제논문 공모전, 논문 경진 대회 등에 출품하는 것이 1차적인 목표였습니다.

그래서 교수님께 수업을 들으며 작성한 논문을 논문 대회에 공모하고자 하는데 가능하냐고 여쭤보았고,

교수님께서 흔쾌히 허락해주셨습니다. ㅎㅎ

(여담이지만 학부생이 직접 대회 지도를 해달라고 찾아온 적은 처음이라고 하셨습니다... ^^)

 

그래서 저희가 참여한 대회는 한국경제신문과 한국경제학회가 주최하는 제18회 한국경제신문 경제논문전입니다.

 

이 공모전의 좋은 점은 공모 주제의 선택지를 제공해준다는 점에서 주제 잡기가 좋습니다. (처음엔 쉬울줄 알았죠)

제18회 대회는 거시-금융, 국제, 재정-산업 분야의 주제가 제공됐습니다.

저희 팀은 아무래도 시계열 분석을 하기 위해서는 거시경제 데이터가 유리할 것이라고 생각하여 "코비드19와 거시경제"라는 키워드를 선택해 논문을 작성하였습니다.

그리고 최근 핫한 주제라 잘 생각해보면 좋은 주제가 많을 것이라고 생각하였거든요.

 


 

2. 분석 과정

사실 논문 작성에서 계량 분석이 차지하는 비중이 절대적이진 않았습니다.

같은 학과 내 친한 선배와 함께 참여했는데, 그 선배는 경제학 이론을 담당하였고 저는 계량 분석을 담당했거든요.

그래서 계량 분석에 초점을 두긴 했지만, 분석에 필요한 이론적 배경 및 모델링하는 과정이 매우 중요했습니다.


(1) 주제 선정

우선 논문을 쓰면서 정말 힘들었던 것은 당연하지만 주제 선정하는 것이었습니다.

현실적으로 분석이 가능할지 / 데이터 확보는 가능할지 / 주제의 화제성 및 중요성 등...여러 기준을 논하며 주제를 정하다보니 브레인스토밍을 떠나서 감을 잡는 것조차 힘들었습니다. ㅎㅎ

우선 둘다 거시경제학보단 미시경제학을 좋아하는 사람들이라 그런지, 처음엔 미시경제학 관련 주제를 하고 싶었거든요.

 

근데 대회 측에서 제시한 키워드에 부합하는 미시 관련 주제가 떠오르지 않았고, 이러한 상황에서 어떤 게 최선일지 고민에 고민을 거듭하였습니다...

특히 주제를 정했다고 하더라도 학부생이 건드릴 수 있는 주제일까에 대한 의문 또한 지워지지 않았고요.

그러다 팀원이 코로나19 관련 외국 논문을 살펴보던 중, 소득불평등 관련 주제를 떠올리게 되었습니다.

코로나19로 인해 소득 격차의 확대가 큰 문제로 대두되고 있다는 것이죠.

 

그래서 이걸 우리나라에 재해석할 수 있는 주제를 탐색하다보니, 한창 문제가 되었던 '내수 침체' 문제가 떠올랐습니다.이 내수 침체의 배경은, 코로나19로 인해 근로 소득이 감소하다보니 자연스럽게 소비 지출 또한 감소한다는 것이었죠.

특히 사회적 거리두기 등으로 인해 수요와 공급 모두 위축됐다는 점에서 코로나19 충격은 기존 총수요 혹은 총공급 한 방향의 충격이 발생했던 다른 경제적 충격과 다른 모습으로 전개됨을 보이고 있었으며, 소비침체와 노동시장 위축으로 인해 가계는 소비성향을 변화시키고 기업은 불확실성에 대비한 가치사슬 전반에 변화를 줄 것이라 예상하였습니다.

그리고 코로나19의 충격을 크게 느끼는 계층은 다름 아닌 저소득층이었습니다.

실제로 외국에서도 코로나19가 야기한 소득감소는 소득불평등도를 증가시키는 방향으로 나타났으며, 향후 감소한 부의 회복 기간(Recovery Time)은 저소득층이 고소득층보다 2배의 기간이 소요된다고 분석했고, 감염 취약 일자리에 위치한 비필수, 비재택, 고접촉 근로자의 대부분은 저소득층이었으며, 이러한 감염 리스크의 증가는 노동의 수요공급 모두 축소시켜 저소득층의 막대한 소득 감소를 초래하였습니다.

 

결국 고소득층의 소득감소보다 저소득층의 소득감소분이 더욱 커 전체 소득불평등이 악화되었습니다.

 

이때 케인즈의 일반균형이론에 따르면 한계소비성향이 높은 저소득층과 한계소비성향이 낮은 고소득층 격차의 확대는 가계 전체 소비 성향의 하락으로 이어져 총소비의 감소를 일으킵니다.

따라서 코로나19로 고소득층과 저소득층 간의 소득격차가 이전보다 더 확대될 위기에 처한 상황에서 소득분배구조의 변화가 우리 경제에 미치는 영향, 특히 내수경기에 미치는 영향에 대한 연구는 정부의 재난지원금 지급 등 소득계층 전반의 지원정책의 유용성과 우선순위를 결정하고 평가한다는 측면에서도 중요한 연구 과제라고 할 수 있으며, 코로나19 사태가 장기화될 가능성이 보이는 시점에서 소득 격차의 확대 흐름을 포착하여 이러한 문제점이 경제성장의 주동력인 가계소비에 어느 정도의 영향을 미치는지 영향력의 크기를 파악할 필요가 있다고 판단했습니다.

 

그래서 저희가 선정한 논문의 제목은 "COVID-19 충격에 따른 소득불평등 심화가 소비침체에 미치는 영향 분석" 입니다.

 

모델링을 포함한 자세한 실증분석에 대해서 다루고 싶지만 나중에 다른 연구로 발전시킬 수도 있지 않을까 싶어서 공개는 패스하겠습니다 :)

 

(2) 데이터 전처리

저희가 분석에 사용한 데이터는 각 분기별 시계열 데이터입니다.

통계청, 한국은행 경제통계시스템 등에서 직접 원하는 변수에 해당하는 자료를 수집하여 Merge하였습니다.

자료의 관측 시점은 1990년 1분기부터 2020년 2분기까지로 설정하였습니다.

 

자료는 대충 이렇게 생겼겠죠.

Time

X1

Xn

Y

1990. 1분기

10889984 53223456 39220029

...

.. .. ..

2020. 2분기

29382817 339483928 23890584

N개의 설명변수와 1개의 반응변수로 이루어져 있습니다.크게 전처리한 건 없긴 합니다.추후 다루겠지만 로그 차분을 이용하기 위해 로그 변환을 통해 Scale을 조정해주었습니다.

사실 로그 변환의 장점은 단위가 굉장히 큰 거시경제 데이터의 Scale 조정도 있지만, 

시계열에서 나타나는 이분산성(Heteroskedasticity)를 완화시키고 경제변수에 내제한 곱셈형 구조적 요인을 덧셈형으로 전환시키는 등의 효과가 있습니다.

 

이렇게 로그 변환을 했음에도 불구하고 시계열자료의 plot를 통해 꾸준히 상승하거나 하락하는 Trend가 관측됩니다.

Trend를 보이는 시계열자료는 통상적으로 불안정한 시계열이라고 하며, 여기서 안정적인 혹은 정상적이라는 용어를 사용합니다.

이에 대한 정의는 다음과 같습니다.

논문 자료를 첨부합니다.

이렇게 Trend를 보이는 데이터를 이용해 회귀분석을 할 경우, 특별한 관련이 없음에도 불구하고 유의미한 선형 관계가 나타난다고 하는 Spurious Regression Problem 문제가 발생한다고 이전에 언급했었죠.

2020/12/18 - [Statistics/Econometrics] - [계량경제학] 시계열 회귀분석(Time Series Regression)의 개념

 

[계량경제학] 시계열 회귀분석(Time Series Regression)의 개념

안녕하십니까, 간토끼입니다. 이번 포스팅부터는 계량경제학의 내용 중 시계열자료를 이용한 회귀분석(Time Series Regression)에 대해서 다뤄보도록 하겠습니다. 1. 시계열 자료(Time Series Data) 먼저 시

datalabbit.tistory.com

그래서 이를 방지하기 위해서는 단위근 검정(Unitroot Test)을 하여 단위근이 있는지 확인해야 합니다.

만약 단위근이 있다고 하면 단위근을 제거해야 안정된 시계열이 되어 분석을 할 수 있게 됩니다.

통상적으로 단위근 검정은 ADF Test를 이용합니다.

이에 대한 자료를 첨부합니다.

논문 자료를 첨부합니다.

 

그래서 단위근 검정 결과 모든 자료에서 유의수준 99% 하에서 단위근이 존재하였으며,

이를 제거하기 위해 로그 차분(Log Differentiation)을 해주었습니다.

논문 자료를 첨부합니다.

로그 차분 결과, 모든 자료에서 단위근이 존재한다는 가설을 유의수준 하에서 기각하였습니다.

 

그러므로 안정적인 시계열이라고 간주할 수 있으며, 이제는 Time Series Regression을 이용해도 문제가 없어 보입니다.

 

대충 이정도 단계가 자료의 처리 단계라고 보시면 됩니다.

 

(3) 데이터 모델링

모델링 단계는 사실 크게 특별한 건 없습니다.

일반적으로 Cross-sectional Data를 이용하여 하듯이 통상적 최소자승법(OLS) 회귀분석을 이용하였습니다.

물론 시계열 자료의 특성상 여러 변수가 서로 다른 시차를 두고 영향을 준다는 점에서 VAR 모형을 주로 사용하긴 하지만, 저희가 배우지 않은 내용을 선뜻 다루기 어려울 것이라는 판단 하에 고급계량연습 수업에서 배운 방법론을 위주로 사용하여 비교적 모델링이 단순하기는 합니다.

사실 개인적으로 Lagged Variable을 넣어 분석했다면 조금은 더 낫지 않았을까 싶긴 합니다.

 

아무튼 위에서 로그 차분한 변수들을 이용해 OLS 회귀분석을 해주었습니다.

 

 

마지막은 분석 결과를 해석하고, 이를 바탕으로 저희의 가설을 채택할 수 있는지,

그리고 그 결과를 바탕으로 COVID-19에 대응할 수 있도록 경제 정책을 제언하였습니다.

나름대로 참고 문헌을 탐색하여 제언하고자 하였는데, 잘 제언했는진 모르겠습니다... ㅎㅎ

 

아무튼 대회 입상은 하진 못했지만, 그래도 교내 캡스톤디자인 수업에서 우수작품상에 선정되었습니다.

 

이래저래 굉장히 뿌듯한 경험이었습니다.

대학원 진학을 고민하는 시점에서 논문 형식을 갖춘 글을 써본다는 것 자체가 굉장히 의미있기도 하고,

교수님께서 직접 지도를 해주셔서 그런지 다른 프로젝트보다도 열심히 참여하기도 했고요.

 

계량경제학, 그리고 통계학의 중요성을 좀 더 알게된 프로젝트였습니다. ㅎㅎ

 

 

감사합니다.

잘 읽으셨다면 게시글 하단에 ♡(좋아요) 눌러주시면 감사하겠습니다 :)

(구독이면 더욱 좋습니다 ^_^)

 

 

 

 


- 간토끼(DataLabbit)

- University of Seoul

- Economics & Data Science

728x90

+ Recent posts