728x90

안녕하십니까, 간토끼입니다.

오늘은 데이터에듀에서 제공받은 2022 빅데이터분석기사 실기 with R에 대한 서평을 작성해보도록 하겠습니다.

 

 

 

사실 제공받은지는 꽤 됐는데요. 심지어 이 책을 이용해서 빅분기 자격증도 취득했는데, 서평 작성을 미루고 미루다보니.. 근 1년은 된 것 같습니다.

아무튼 빅데이터분석기사 자격증은 데이터 분석 쪽에서 꽤나 매력적인 자격증임은 분명합니다.

국가공인 자격증이기도 하고, "기사"라는 점에서 공신력도 좋죠.

사실 난이도는 그렇게 높은 자격증은 아니어서, 자격증이 있다고 해도 크리티컬하게 영향을 주는 자격증은 아니긴 하지만요.

그래도 있으면 절대 손해보는 자격증은 아니라고 생각합니다.

채용 공고상에 가산점을 주는 기업들을 지원할 때 어필할 수 있는 정도라고 생각합니다.

 

728x90

 


Q. 이 책은 어떤 책인가요?

빅데이터분석기사 자격증의 실기 시험 합격을 위해 노력하는 수험생을 위한 책입니다.

특히 이 책은 실기 평가 간 "R 프로그래밍" 언어를 사용하려는 분들을 위한 책입니다.

저는 예전부터 R 사용 비중이 높았어서 당연히 R을 쓰려고 했는데,

막상 시험을 보려고 하니 빅분기 응시자 중 파이썬 선택 응시자의 비율이 훨씬 더 높더라고요?

아무래도 깊게 들어가는 게 아니라면 R 보다는 파이썬이 좀 더 쉽게 다가와서 그런 것 같습니다. 라이브러리 활용도도 높고요.

그래도 저는 R이 편하더라고요. 특히 이런 시험의 특성상 실기 시험이 꽤나 정형화돼있기 때문에 R 코드를 크게 변형할 일이 없습니다.

이 책의 구성을 한번 살펴보죠.

 

Ⅰ. 필답형
1과목. 빅데이터 분석 기획

제1장 빅데이터의 이해
제1절 빅데이터 개요 및 활용
제2절 빅데이터 기술 및 제도

제2장 데이터 분석 계획
제1절 분석 방안 수립

제3장 데이터 수집 및 저장 계획
제1절 데이터 수집 및 전환
제2절 데이터 적재 및 저장

예상문제

2과목. 빅데이터 탐색

제1장 데이터 전처리
제1절 데이터 전처리
제2절 분석 변수 처리

제2장 데이터 탐색
제1절 데이터 탐색 기초
제2절 고급 데이터 탐색

제3장 통계기법 이해
제1절 기술통계
제2절 추론통계
예상문제

3과목. 빅데이터 모델링

제1장 분석 모형 설계
제1절 분석 모형 구축
제2절 분석 환경 구축

제2장 통계 분석기법
제1절 회귀분석
제2절 범주형 자료 분석
제3절 다변량 분석
제4절 시계열분석
제5절 비모수 통계

제3장 정형 데이터 분석기법
제1절 분류분석
제2절 연관분석
제3절 군집분석

제4장 딥러닝
제1절 딥러닝의 개요
제2절 인공신경망
제3절 심층 신경망
제4절 합성곱 신경망
제5절 순환 신경망
제6절 LSTM

제5장 비정형 데이터 분석기법
제1절 텍스트 마이닝
제2절 사회연결망 분석

예상문제

4과목. 빅데이터 결과 해석

제1장 분석모형 평가 및 개선
제1절 분석모형 평가
제2절 분석모형 개선

제2장 분석결과 해석 및 활용
제1절 분석결과 해석
제2절 분석결과 시각화

예상문제

Ⅱ. 작업형
1과목. R 기초

제1장 R 기초
제1절 R 프로그래밍 언어
제2절 R 설치

제2장 R 기본
제1절 R 다루기
제2절 R 기초 중의 기초
제3절 데이터 타입
제4절 자주 사용하는 함수
제5절 데이터 입출력
제6절 사용자 정의 함수

2과목. 데이터 전처리

제1장 제어문
제1절 조건문
제2절 반복문

제2장 데이터 변환
제1절 파생변수 생성
제2절 변수 축소

제3장 데이터 결합 및 요약
제1절 데이터 결합
제2절 데이터 요약
제3절 apply 계열 함수
제4장 패키지를 활용한 데이터 전처리
제1절 plyr
제2절 dplyr
제3절 reshape2
제4절 data.table

제5장 결측치
제1절 결측치 인식
제2절 결측치 처리
제3절 이상치 인식

제6장 기타 데이터 전처리
제1절 날짜 데이터 다루기
제2절 문자 데이터 다루기

예상문제

3과목. 통계분석

제1장 상관분석
제1절 상관계수 검정

제2장 회귀분석
제1절 단순선형회귀분석
제2절 다중선형회귀분석

4과목. 데이터 마이닝

제1장 데이터 분할과 성과분석
제1절 데이터 분할
제2절 성과분석

제2장 분류분석
제1절 로지스틱 회귀분석
제2절 의사결정나무
제3절 앙상블 기법
제4절 SVM
제5절 나이브 베이즈 분류
제6절 K-NN
제7절 인공신경망 모형

제3장 군집분석
제1절 군집분석
제2절 계층적 군집분석
제3절 비계층적 군집분석

예상문제

모의고사
1회 모의고사
2회 모의고사
3회 모의고사
기출문제
제2회 빅데이터 분석기사 시험문제
제3회 빅데이터 분석기사 시험문제

이 책의 구성은 시험 구성과 동일하게 이루어져 있습니다.

필답형, 그리고 작업형1, 작업형2를 준비할 수 있도록 과목에 맞는 챕터와 더불어 마지막엔 종합적으로 풀어볼 수 있는 모의고사 및 기출문제가 수록되어 있습니다.

근데 이걸 쓰면서 알았는데 ... 문제는 이번 6월 시험부턴 필답형이 사라지고 작업형1, 2, 3으로만 출제가 된다고 하네요.

당황스럽습니다 ...

새로 추가된 작업형 3유형은 "통계적 가설 검정"에 대한 파트네요.

이 파트를 공부하시면 사회조사분석사 2급 자격증도 같이 준비할 수 있겠네요. 내용이 겹치거든요.

어쨌든 저는 이 책을 리뷰해야하니... 작업형 1, 2에서 어떻게 도움되는지 알려드리겠습니다.


Q. 그럼 누구에게 추천하는 책인가요?

내용이 꽤나 상세합니다.

제 생각엔 빅분기 자격증 취득을 위해 데이터 분석을 처음 접해본 분이나, 원래 분석을 해보셨던 분들 모두 읽으셔도 큰 도움이 될 것 같습니다.

만약 데이터 분석을 처음 접해본 분이라면 결국 프로그래밍 언어에 얼마나 익숙해지냐가 관건입니다.

처음부터 쭉 따라쳐보면서 R의 문법을 익히셔야 합니다.

특히 빅분기는 오픈북 시험이 아니기 때문에, 시험장 가서 문법 생각이 안 나면 말짱 꽝입니다.

그래도 이 책은 각 파트별로 문제 유형에 대한 코드가 상세히 기술돼있습니다.

R이 생각보다 어려운 언어는 아니어서요. 계속 따라치시다보면 어느 순간부터는 패턴이 눈에 보일 겁니다.

 

원래 데이터 분석을 해보셨던 분이라면 과감히 건너뛰고 모의고사로 이동하시길 추천드립니다.

그냥 문제만 풀어보셔도 패턴이 보입니다. 빈출 함수만 기억하시고 접근하셔도 무방하다고 생각합니다.

 


Q. 이 책의 장점은 무엇인가요?

워낙 ADsP 교재로 유명한 서적이니, 데이터 분석 시험에서 강조하는 포인트들을 잘 담고 있습니다.

디자인 자체도 ADsP 민트 책이랑 비슷해서요. 상대적으로 친숙한 느낌이 많이 드네요.

 

그리고 예상 문제(모의고사)와 실제 기출문제가 잘 수록돼있어서 실전 경험을 쌓기 좋습니다.

이런 자격증 시험은 이론도 중요하지만 결국 많은 문제를 풀어봄으로써 실전 경험을 갖추는 게 중요하거든요.

작업형 2 파트를 예로 들면 보시다시피 데이터 분석 프로세스의 각 단계별 코드와 설명이 잘 기술돼있습니다.

이정도면 이해하기 어렵지 않을 거라 생각합니다.

모델링 때 활용 가능한 코드도 잘 있네요.

다만 아쉬운 건 각 모델의 하이퍼 파라미터의 설명(주석)이 있는 모델도 있고, 아닌 모델도 있네요.

어느정도 할 줄 아는 분들은 다 아시겠지만, 초심자에겐 다소 어렵지 않을까 싶습니다.

초보 분들은 그냥 코드만 따라치다보면 어떤 의미인지 깊게 생각을 안해보고 치는 경우가 많아서... 시험장에서 헷갈릴 수 있지 않을까 싶습니다.

물론 책의 앞부분에 각 모델별로 코드 짜는 법이 설명돼있지만, 다시 넘겨보기 귀찮잖아요~

이왕 적는 거 각 모델의 코드마다 주석이 달려있으면 좋았겠다는 생각이 듭니다.

 

아무튼 이 책만 있어도 합격은 충분하다고 봅니다.

단!! 작업형3이 추가된 게 사고인데 ... 작업형 1,2에 대한 설명이 좋으니 작업형 3도 잘 설명돼서 출간되겠죠? ㅎㅎ

 

감사합니다.

 

‘이 글은 데이터에듀로부터 도서를 제공받아 작성된 글입니다.’

 


- 간토끼(DataLabbit)

- University of Seoul

- Economics & Data Science

 

728x90

+ Recent posts