728x90

안녕하십니까, 간토끼입니다.

오늘은 빅데이터, 데이터분석 등 분야에서 요긴하게 쓰이는 자격증인 ADP(데이터분석전문가) 시험의 필기 합격 후기를 작성해보겠습니다.

ADsP와는 다른 자격증입니다!

 

학부 4학년 시절 ADsP(데이터분석준전문가) 자격증은 취득했었습니다.

2020.09.10 - [Records/Certificate] - [자격증] ADsP(데이터분석준전문가) 자격증 취득 후기(책 추천 / 공부 기간 등)

 

[자격증] ADsP(데이터분석준전문가) 자격증 취득 후기(책 추천 / 공부 기간 등)

안녕하십니까, 간토끼입니다. 오늘은 빅데이터, 데이터분석 등 분야에서 요긴하게 쓰이는 자격증인 ADsP(데이터분석준전문가) 자격증에 대해서 다뤄볼까 합니다. 지난 포스팅( 2020/07/01 - [Records/Ce

datalabbit.tistory.com

 

어느덧 약 2년의 시간이 지났네요!

 

현재는 장교로 군 복무를 하고 있어 공부를 하기가 썩 제한되는데요. (저는 개인적으로 그렇습니다 ...

퇴근하고 공부하는 것도 힘들고, 주말에는 당직이 종종 있다보니 꾸준하게 공부하는 게 힘드네요 ㅠㅠ)

간만에 굳은 머리를 환기하는 느낌으로 뭘 해볼까 하다가 이 ADP를 떠올리게 되었습니다.

 

통상 ADsP는 비전공자부터 전공자까지 다양한 분들이 많이 취득하곤 하죠.

특히 요즘은 기업에서 빅데이터 관련 역량을 다양한 직무에서 우대하다보니 이를 위해 ADsP를 취득하는 분들도 많아지고 있는 추세더라고요.

ADP도 마찬가지로 데이터 분석 관련 자격증으로, 한국데이터산업진흥원에서 주관하는 국가공인 자격증 시험입니다.

난이도만 놓고 봤을 때는 비슷한 자격증인 빅데이터분석기사보다도 더 어렵지 않을까 싶긴 하네요.

 

ADP를 응시하려는 분들은 대충 이 분야에 대해서 아는 분들일테니 ADsP와 ADP의 차이점만 비교해보죠.

 

 

먼저 ADsP의 필기 시험 출제 문항입니다.

과목은 크게 3과목으로, 데이터 이해, 데이터분석 기획, 데이터분석 순으로 이루어져 있죠.

문항수는 총 10 /10 / 30 으로 50문항이고, 이중 10문항이 단답형입니다.

 

이어서 ADP의 필기 시험 출제 문항입니다.

필기는 총 5과목에서 출제되며, 당연히 데이터분석 파트가 비중이 제일 큽니다.

ADsP와 겹치는 문항은 데이터 이해, 데이터분석 기획, 데이터분석이 되겠으며 데이터처리기술이해와 데이터 시각화는 ADP에서만 나오는 과목입니다.

 

그리고 단답형 문항이 있는 ADsP와 다르게 ADP에서는 서술형이 있습니다.

서술형은 '데이터분석' 파트에서만 출제되는데요.

사실 이 서술형이 어떻게 보면 부담스러울 수도 있지만, 어떻게 보면 혜자 문항입니다.

전공자 입장에서는 매우 좋거든요 ...

 

기타 차이점으로는 시험 문항의 개수는 약 2배 차이가 나고, 이에 따라 시험 시간도 2배 정도 ADP가 더 깁니다.

사실 3시간까지 채울 시험은 아니에요. 충분히 그 안에 끝낼 수 있습니다.

 

자 그럼 이제 ADP에 대해서 좀 더 작성해보겠습니다

 

1. 데이터이해 & 데이터분석 기획

이 두 과목은 ADsP를 하셨던 분들이라면 매우 유사합니다.

오히려 저는 단답형 없이 객관식으로만 하니까 암기 부담이 적어져서 좋았던 것 같아요.

암기를 싫어하는 데이터분석 지망생들이라면 땡큐 파트입니다.

 

2. 데이터 처리 기술 이해

뭐랄까 정보처리기사 같은 느낌이랄까요.

데이터베이스 기술에 대한 내용도 나오고, 데이터처리방법에 대해서도 나옵니다.

데이터웨어하우스, CDC, EAI, ODS, 하둡(Hadoop), 분산 데이터 저장기술, 클라우드 컴퓨팅 등 ...시험이 끝난 지금도 키워드를 하나도 모르겠지만, 딱히 암기 없이 문제만 열심히 풀었습니다.

암기에 약한 제가 항상 시험 때마다 준비하는 방식은 '감'을 익히는 겁니다.

기계학습처럼...? 이랄까요. 수많은 데이터(문제)로 풀다 보면 최적해에 근접해지게 되겠죠.

그러다보면 정답을 예측할 가능성도 높아지겠고, 이게 왜 정답인진 모르겠지만 정답을 향해 체크하게 되는 뭐 그런 ...

 

농담이고, 그냥 개념 한번 싹 보고 문제를 열심히 풀다 보면 과락은 나오진 않습니다.

저도 과락만 나오지 말잔 심정으로 공부했었습니다.

 

3. 데이터시각화

시각화 인사이트 프로세스, 시각화 디자인, 시각화 구현 크게 3가지 파트에서 출제됩니다.

R프로그래밍에 익숙한 분들은 대표적인 라이브러리 중 하나인 ggplot에 대한 코드들이 나와서 반가울 겁니다.

다만 이는 '시각화 구현'에 해당하는 거고, 앞부분인 시각화 인사이트 프로세스, 시각화 디자인은 소위 암기 파트입니다.시각화의 개념부터 효과적으로 시각화하는 방법, 시각화할 수 있는 기법 등 개념적인 부분이 나오는데 크게 어렵지는 않습니다. 마찬가지로 문제를 풀기 위한 '감'을 익히신다면 좋을 겁니다.

 

4. 데이터분석

오히려 ADP에 도전하시는 분들은 다른 과목들보다도 이 파트에 자신있어서 응시하는 분들이라고 생각합니다.

저도 그렇고요.그런 분들이라면 별 다른 공부없이 각 파트별로 문제만 풀어보셔도 충분할 것이라 생각합니다.

난이도가 ADsP에서 막 높지는 않은데, 다만 분량이 좀 많습니다.

특히 기초통계보다는 회귀분석 등 통계분석 이후부터 기계학습(정형데이터마이닝), 비정형데이터마이닝에 초점을 둬서 공부하셔야 합니다.

개인적으로는 간만에 기계학습 내용을 공부하니 재밌더라고요. 다른 분들도 마찬가지일 거라 생각합니다(?)

 

통계분석과 기계학습은 서술형을 위해서라도 어느정도 심도있게 공부하실 필요가 있습니다.

개인적으로는 이 파트만큼은 유튜브 등 영상 플랫폼을 통해서 기법에 대한 이해를 갖추고 가는 게 좋다고 생각합니다.

단순히 암기만으로는 해결이 되지 않는 부분이 많을 거라 생각해요.

 

저는 서술형 준비를 각 잡고 한 건 아니었는데요.

그냥 다들 많이 쓰는 데이터에듀 출판사의 책을 사용했습니다.

보니까 서술형 파트만 모아서 준비시키는 게 있더라고요.

근데 막상 시험을 보니 별 도움이 되지 않았습니다.

그냥 제가 평소에 알고 있던 지식으로 풀었는데 다행히 다 맞았더라고요.

우선 이번 26회 데이터분석전문가 필기에서는 어떤 서술형 문제가 나왔는지 알려드릴게요.

 

ADP(데이터분석전문가) 26회 필기 서술형

1-2번

 

전형적인 기계학습에서의 과대적합(Overfitting) 그래프가 나왔습니다.

이때 test set에서의 loss 함수가 Epoch가 50? 정도였나 아무튼 중간 지점을 넘어서부터 꺾이기 시작하여 loss가 커지던 양상이었습니다.

1번 문제는 Epoch가 100까지 갔을 때 나타나는 문제점이었고,

당연하게도 과대적합에 대해서 설명해주시면 됩니다.

 

2번 문제는 1번에서 나타나는 문제점을 해결하기 위한 방법입니다.

과대적합의 해결방법으로는 다음과 같겠죠.

1) 조기종료(Early Stopping)

2) 드롭아웃(Dropout)

3) 학습 데이터 늘리기

4) L1 / L2 정규화

등 ... 2가지만 적으라고 문제에서 그랬으니, 저는 조기종료와 학습 데이터의 수를 늘리는 방법에 대해 서술했습니다.

 

3-4번

모델 A, B가 주어지고 해당 모델의 Confusion Matrix가 같이 주어졌습니다.

 

3번 문제는 각 모델의 정확도(Accuracy Score)와 F1 Score를 구하는 문제였습니다. 쉬운 문제죠?

F1-Score를 구하는 공식만 알고 있으면 무난한 문제입니다.

 

4번 문제는 3번의 답을 토대로 어떤 모델이 좋은 모델인지 구하는 문제였습니다.

3번에서의 답은 A와 B 중 A의 정확도가 조금 더 높았고, B의 F1 Score가 조금 더 높았었습니다.

이를 바탕으로 B가 더 좋은 모델이라고 서술했으며, Accuracy Score의 단점인 정확도의 역설 개념(5건이 정답이고, 95건이 오답인 데이터에서 100건 모두 오답으로 예측하는 똥같은 모델도 정확도가 95% 나오는 문제)에 대해서 서술하였고, F1 Score가 Recall과 Precision의 조화평균임을 강조하며 왜 분류기의 성능을 보다 잘 측정하게 도와주는 지표인지에 대해서 작성했습니다.

그랬더니 만점인 20점이 나왔네요.

 

그래서 결론은 문제가 그렇게 어렵지는 않지만, 책 속에 나온 문제은행만 달달 보기에는 낭패를 볼 수 있습니다.

물론 문제은행과 유사하게 나오는 문제들도 있지만, 서술형 문제는 과대적합 문제처럼 이 분야에 익숙하지 않은 분들은 처음 보는 경우도 있을 거라 생각합니다.

그래서 서술형은 책 속의 예시 문제만 보시는 것보다는 인터넷의 시험 후기를 찾아서 최근 시험의 기출문제 위주로 보시고, 개인적으로 통계분석 파트보다는 기계학습 파트의 문제들을 위주로 보시는 것을 추천합니다.

뭔가 요즘 트렌드같더라고요. 아무래도 딥러닝을 포함한 기계학습이 요즘 인기다보니...

 

저는 문제집을 데이터에듀 출판사의 데이터분석전문가 교재를 사용했습니다.

다만 학부 시절에 따려고 샀던 터라 2020년도에 출시된 책을 이용해서 공부를 했는데요.

그러다보니 2022년에 출시된 책에는 어떤 게 더 보완됐는지 솔직히 모르겠습니다. 

그냥 그 문제집이 그거겠거니 싶어서 새로 안 사고 2년 된 책을 이용해서 공부했어요.

 

이것만 놓고 봤을 때는 시험 문제가 교재의 문제들처럼 나오지는 않았다는 게 시험 총평입니다.

그래서 문제은행을 굳이 외우실 필요보다는 문제들을 풀면서 '감'을 익히시는 게 좋을 것 같습니다.

사실 제 실제 공부시간은 3일도 채 안 됐습니다.

그런 것치고는 시험을 비교적 잘 본 것 같아서 다행이었는데요.

일하다보니 바빠서 시험 전에 바짝 공부한 게 전부인데, 학부 시절 데이터분석 파트는 탄탄하게 해놓으니까 문제 좀 풀었더니 감이 금방 돌아오더라고요.

오히려 데이터처리기술 등 익숙하지 않은 파트가 공부하기 어려웠습니다...

 

비전공자 입장에서는 ADsP보다는 탄탄하게 공부해야 합격하실 거라 생각합니다.

어차피 실기까지 해야하는 시점에서 기계학습 파트를 열심히 공부하시는 것을 추천드립니다.

나머지는 솔직히 암기 파트니까 개인의 노력에 따라 갈리겠지만, 데이터분석 파트는 역량에 따라 갈릴테니 꾸준하게 공부하시는 게 좋지 않을까 싶습니다.

 

결론은 전공자 입장에서는 오랜 시간 투자하실 거 없이 데이터분석 파트는 문제를 싹 풀어보시고 본인에게 약한 파트 위주로만 공부하시면 되고, 서술형 문제도 마찬가지로 답안을 직접 작성해보시는 것만 익히면 충분합니다.

나머지 과목은 개념보다는 문제 위주로 풀면서 감을 익히면 될 것 같습니다.

풀다 보면 자주 나오는 개념들이 있길래 해당 개념 위주로 공부했습니다.

 

비전공자는 우선적으로 책을 싹 공부하시고, 데이터분석 파트에서 본인에게 약한 파트는 반드시 유튜브를 이용해서 기법에 대한 영상을 시청하세요.

통계분석도 마찬가지고, 기계학습은 꼭 보시는 걸 추천합니다!!

책 속의 설명보다는 영상 한번 시청하시는 게 이해가 쏙쏙 돼서 헷갈리지 않게 됩니다. 장담해요!

 

그외 궁금한 사항은 댓글 남겨주세요.

 

감사합니다.

잘 읽으셨다면 게시글 하단에 ♡(좋아요) 눌러주시면 감사하겠습니다 :)

(구독이면 더욱 좋습니다 ^_^)

 

 

 

 


- 간토끼(DataLabbit)

- University of Seoul

- Economics & Data Science

728x90

+ Recent posts