728x90

안녕하십니까, 간토끼입니다.

이번 포스팅은 작년에 수상했던 제1회 문화체육관광 빅데이터활용 아이디어 공모전 수상 경험(?)에 관해 다뤄볼까 합니다.

여러 공모전을 준비하며 수상해본 경험에 미루어 보았을 때, 데이터 관련 공모전은 크게 세 분류로 구분됩니다.

1) 데이터 분석 기법 및 알고리즘을 활용한 구상 위주의 아이디어 공모전
2) 알고리즘을 '직접' 활용해 데이터를 분석함으로써 도출한 인사이트 기반의 아이디어 공모전
3) 데이터 분석 역량 위주의 분석 경진대회(일종의 Competition)

아무래도 1번의 케이스가 입문자에게 있어서도 가장 무난하죠. 실제 데이터의 분석 없이 아이디어만으로도 수상이 가능하니깐요.

2번의 케이스분석 역량과 더불어 해석하고 응용할 수 있는 역량까지 평가됩니다. 즉 데이터를 분석할 줄 모르면 말짱 꽝입니다.

3번의 케이스는 개인적으로 고수(?)들의 영역이라고 생각합니다. 실제로 캐글, 데이콘 등의 플랫폼에서 이러한 경험을 하실 수 있는데요.
다 필요없이 데이터를 얼마나 잘 다루고 예측을 잘하는지만 평가하기 때문에, 여러 알고리즘을 다양하게 사용하고 응용할 수 있어야 합니다.

뭐 자세한 건 나중에 다뤄보도록 하고요.
저같은 경우는 주로 2번에 해당하는 경험이 많은데, 그중 이번 포스팅은 빅린이(?) 시절 수상했던 1번 케이스에 관한 경험입니다.
(아직도 빅린이인 건 마찬가지네요.)
분석보다도 아이디어 위주로 제안하여 상을 받았었는데요.

대부분의 입문자분들도 분석 기법에 대한 이해만 있다면 부담없이 참여할 수 있는 대회라고 생각합니다.
그럼 그와 관련한 경험과 팁을 소개해보도록 할게요.



제가 참여한 대회 포스터인데요.
문화체육관광 분야의 빅데이터를 활용한 다양한 창업 or 서비스 아이디어를 제안하면 되는 방식입니다.
간단하죠?

사실 저는 문화나 관광 등의 분야엔 크게 관심이 없습니다.
그래서 그~나마 관심있는 체육 쪽에 초점을 두어 아이디어를 떠올려봤어요.

마침 주52시간 제도의 시행으로 인해 여가 시간이 늘어난 현대인이 많다라는 사실과, 그럼에도 불구하고 여가를 잘 보낼 수 있는 방법을 몰라 TV 시청 등의 소극적인 여가를 즐기는 사람이 많다는 것을 깨닫고, 이러한 문제를 해결할 수 있는 아이디어를 고민해보았습니다.
그 결과 다음과 같은 아이디어를 제안하였습니다.

바로 대국민 맞춤형 운동 서비스 - 코치코치(KOACH KOACH) 입니다.
코치코치(KOACH KOACH)란,
본인에게 가장 적합한 여가 스포츠를 추천해주고, 추천한 스포츠를 할 수 있는 장소와 운동 방법 등을 다양한 데이터를 활용해 지도해주는 코치(Coach)같은 존재이자, 무엇이든 '꼬치꼬치' 캐물어도 답변해줄 수 있는 만능 스포츠 추천 서비스라는 의미를 갖고 있습니다.
(저 스스로 생각했습니다 ㅎㅎ)

그렇기에 코치코치(KOACH KOACH)는 여가 스포츠를 책임져주는 코치(Coach)와 국민체육진흥공단(KSPO)의 합성어입니다.

무단 도용 방지를 위해 워터마크를 삽입하느라 로고가 다소 지저분합니다 ^^;


로고도 파워포인트를 이용해 직접 만들어봤습니다. 사실 전 이런 디자인쪽 재능이 전무해서요.. ㅎㅎ
잘 만들진 못했지만 나름대로 노력해봤습니다.

그래서 코치코치 서비스는 먼저 사용자의 정보를 수집한 후,
다양한 국민체육진흥공단의 공공데이터를 이용국민들의 다양한 여가 케이스 Cluster를 만든 후에
신규 서비스 이용자와 기존 Cluster를 매치하여 적합한 Cluster 유형을 추천해주는 방식입니다.


이를 위해 추천 서비스군집분석 등의 분석 기법을 활용하는 방법을 제안하였습니다.


자 그럼 이런 아이디어 공모전에서 수상할 수 있는 나름의 팁을 소개해드릴게요.
단 빅데이터 분석 기법이나 머신러닝 알고리즘에 대한 최소한의 이해가 있다는 전제 하에 소개하니, 참고하시기 바랍니다.

1. 공모전 주제에 맞는 여러 이슈를 탐색한다.
- 먼저 공모전이 어떤 성격인지 파악합니다.
자사의 서비스를 개선하거나 신규 서비스를 제안하는 것인지,
혹은 사회 이슈를 기반으로 하는 서비스 아이디어를 제안하는지 살펴봐야 합니다.

예를 들어 위 대회의 경우, '문화체육관광'이라는 폭 넓은 서비스이니까 사회 이슈를 기반으로 사회 문제를 해결할 수 있는 아이디어일 가능성이 높습니다.
그러므로 이에 맞도록 사회 이슈를 해결할 수 있는 서비스를 고민해보는 것이 좋죠.
이를 위해 시중에 관련 서비스가 있는지 살펴보고, 있다면 이를 디벨롭할 수 있는 방법이나 혹은 차별화된 아이디어를 다시 고민해보는 것도 좋습니다.

자사의 서비스와 관련된 경우 보통 '@@(자사)의 데이터를 이용해~' 등으로 명시되어 있는데요.
이와 관련한 수상 경험은 추후 포스팅에서 다뤄보도록 하겠습니다.


2. (1)에서 정한 사회 이슈에 걸맞는 데이터를 탐색한다.
- 사실 1번이나 2번이 정해진 순서는 아닙니다.
개인적으로 데이터를 먼저 탐색하고, 데이터를 보면서 번뜩인 아이디어를 바탕으로 이를 응용할 수 있는 이슈와 연결해도 괜찮은 접근이라고 생각해요.
하지만 1번을 먼저 떠올린 후 2번을 고민한다고 하면,
공공데이터포털 등 플랫폼에서 데이터를 살펴보면서 (1)에서 떠올린 아이디어와 연결할 수 있는 '데이터의 파일명' 등을 위주로 보면 좋습니다.
실제로 열어보며 데이터와 아이디어를 연결지을 수 있는 방법을 떠올리시면 도움이 될 겁니다.

3. (2)의 데이터를 가상으로 분석한다면 어떤 기법을 적용해 분석하고, 응용할 수 있는지 고민한다.
- 먼저 본인의 데이터와 아이디어가 어떤 문제인지 살펴봐야죠.
만약 지도학습 기반의 예측이 주목적이라면 지도학습의 회귀(Regression), 분류(Classification) 로 나누어 이에 맞는 기법을 고민하셔야 되겠고, 비지도학습 기반의 군집분석 등이 주목적이라면, K-Means 등 군집분석 알고리즘의 예시를 적어주며 나름의 구체성과 전문성을 드러내주시면 좋습니다.

단 이를 위해 최소한의 알고리즘에 대한 지식은 있어야겠죠 ^^;

이 3단계의 과정을 거치면 어느 정도 괜찮은 아이디어가 도출될 수 있지 않나 싶습니다.

가장 좋은 건 분야를 가리지 않고 다양한 데이터 활용 사례를 살펴보며 영감을 얻는 것이 좋습니다.

결국 대부분의 아이디어는 큰 틀에서 보았을 때 어느 데이터를 썼냐 정도의 차이일뿐 기법이나 응용 방법은 비슷하더라고요.

참고하셔서 좋은 결과 얻으시길 바랍니다.


부상으로 꽃다발과 상장, 상금을 받았었습니다.
꽃다발이 생각보다 커서 놀랐습니다만, 기뻤던 경험 중 하나입니다.



감사합니다.
잘 읽으셨다면 게시글 하단에 ♡(좋아요) 눌러주시면 감사하겠습니다 :)
(구독이면 더욱 좋습니다 ^_^)




- 간토끼(DataLabbit)
- University of Seoul
- Economics, Data Science

728x90

+ Recent posts