728x90

안녕하십니까, 간토끼입니다.

 

오늘은 한빛미디어의 <나는 리뷰어다 2021>의 일환으로 받은 머신러닝을 활용한 웹 최적화에 대한 서평을 작성해보도록 하겠습니다.

 

 

제 블로그를 보신 분들은 아시겠지만, 제가 리뷰하는 대부분의 책들은 머신러닝, 혹은 딥러닝에 관련한 서적입니다.

그야말로 머신러닝 열풍이라고 할 수 있을 정도로 머신러닝에 관한 책이 많이 출판되고 있어요.

물론 개중엔 입문 서적의 비중이 제일 높긴 합니다만, 흥미로운 건 타 분야와 연계된 머신러닝 서적도 많이 출판되고 있다는 것이죠.

이 책은 그러한 책 중 하나입니다. 바로 웹 최적화(Web Optimization)에 머신러닝을 도입한 책이죠!

 

듣기만 해도 무슨 책일지 궁금한 이 책은 웹페이지를 보다 효율적으로 관리하면서 페이지의 유입을 효과적으로 늘리고 싶은 분들에게 추천하는 책입니다.


Q. 이 책은 어떤 책인가요?

웹 최적화에 머신러닝을 도입한 국내 최초의 책입니다.

우리는 일상에서 접하는 대부분이 인터넷과 연결된 4차 산업혁명 시대에 살고 있죠.

네이버, 다음, 구글 등 포털 사이트 없이는 어떻게 살 수 있을까 싶을 정도로 일상 속에서 수많은 웹페이지의 도움 덕에 살아가고 있습니다.

작게는 맛집 검색부터 생활에 필요한 정보, 여행지 가이드, 심지어 이렇게 제 블로그에서 유익한(?) 정보를 제공하는 것까지 다양한 웹페이지에서 수많은 정보를 다루고 있습니다.

이용자 입장에서 가장 중요한 건 '이 페이지가 내가 찾는 정보를 정확히 줄 수 있냐'는 것이죠.

그리고 서비스 제공자 입장에서는 당연히 이용자의 유입을 늘리기 위해서는 이 기준을 충족할 수 있어야 할 것이고요.

뭐 저처럼 자기 만족으로 블로그를 운영하는 사람들에게는 이용자의 유입 자체가 기쁜 일이겠지만,

이용자의 유입이 곧 구매로 이어지고, 이윤 창출로 이어지는 온라인 스토어 등에게 있어서는 단순히 유입만으로 끝나는 것이 아니라 구매까지 할 수 있도록 소비자의 유입 경로를 세밀하게 살펴보고 소비자에게 최고의 경험을 제공하는 것이 중요합니다.

 

하지만 이 웹페이지의 사용자는 개발자가 생각하는 것과는 다르게 반응하고 행동하죠.

왜냐하면 사용자는 너무나 많고 생각하는 것도 다양하기 때문에 어설픈 방법으로는 이 행동을 예측할 수 없게 됩니다.

 

이때 A/B 테스트로 대표되는 최적화 기술은 사용자의 선택을 예측함으로써 웹페이지를 보다 효과적으로 설계할 수 있는 기반이 됩니다.

예를 들어 특정 아이콘을 삽입하는 것이 좋을지, 안 좋을지에 대한 논의도 소비자의 클릭률 등의 특정 '지표'를 바탕으로 가설 검증에 활용해 더 나은 최적화 설계를 할 수 있도록 해주죠.

 

그래서 이 책은 통계학, 머신러닝이라는 수리적인 방법론을 이용해 최적화를 설명하고, 실제 파이썬 코드를 통해 구체적으로 알기 쉽게 정리한 책입니다.

목차를 설명하면 다음과 같습니다.

 

더보기

CHAPTER 1 A/B 테스트부터 시작하자: 베이즈 통계를 이용한 가설 검정 입문

1.1 A/B 테스트의 영향
1.2 앨리스와 밥의 보고서
1.3 확률 분포
1.4 베이즈 정리를 이용한 클릭률 추론
1.5 다른 해결책 1: 반복 모으기
1.6 다른 해결책 2: 베타 분포
1.7 사후 분포를 이용한 결단 내리기
1.8 정리
칼럼: 실험 설계의 기본 원칙

CHAPTER 2 확률적 프로그래밍: 컴퓨터의 도움을 받자

2.1 통계 모델 기술과 샘플링 실행
2.2 진정한 리뷰 점수
2.3 체류 시간 테스트하기
2.4 베이즈 추론을 이용한 통계적 가설 검정을 하는 이유
2.5 정리

CHAPTER 3 조합 테스트: 요소별로 분해해서 생각하자

3.1 찰리의 보고서
3.2 효과에 주목한 모델링
3.3 통계 모델 수정
3.4 완성한 보고서, 잘못된 모델
3.5 모델 선택
3.6 정리
칼럼: 직교 계획과 웹 최적화

CHAPTER 4 메타휴리스틱: 통계 모델을 사용하지 않는 최적화 방법

4.1 마케팅 회의
4.2 메타휴리스틱
4.3 언덕 오르기 알고리즘
4.4 확률적 언덕 오르기 알고리즘
4.5 시뮬레이티드 어닐링
4.6 유전 알고리즘
4.7 정리
칼럼: 유전 알고리즘과 대화형 최적화
칼럼: 웹 최적화와 대화형 최적화

CHAPTER 5 슬롯머신 알고리즘: 테스트 중의 손실에도 대응하자

5.1 소박한 의문
5.2 다중 슬롯머신 문제
5.3 .-greedy 알고리즘
5.4 시뮬레이티드 어닐링 .-greedy 알고리즘
5.5 소프트맥스 알고리즘
5.6 톰슨 샘플링
5.7 UCB 알고리즘
5.8 에렌의 질문에 대한 답변
5.9 정리
칼럼: 최적 슬롯 식별 문제

CHAPTER 6 조합 슬롯머신: 슬롯머신 알고리즘과 통계 모델의 만남

6.1 다시 찰리의 보고서
6.2 선형 모델과 일반화 선형 모델
6.3 MCMC를 슬롯머신에 사용하기
6.4 베이즈 선형 회귀 모델
6.5 LinUCB 알고리즘
6.6 정리
칼럼: 개인화에서의 응용

CHAPTER 7 베이즈 최적화: 연속값의 솔루션 공간에 도전하자

7.1 마케팅 회의
7.2 베이즈 최적화
7.3 가우스 과정
7.3.1 커널 트릭
7.4 컴퓨터와 대화하며 최적의 색 찾기
7.5 GP-UCB 알고리즘
7.6 GP-TS 알고리즘
7.7 응용 시 주의할 점
7.8 에렌의 질문
7.9 정리
칼럼: 베이즈 최적화를 대화형 최적화에 응용하기

CHAPTER 8 앞으로의 웹 최적화

8.1 단기적인 평가와 장기적인 평가
8.2 솔루션 공간 디자인
8.3 웹사이트 이외의 응용

APPENDIX A 행렬 연산 기초
A.1 행렬 정의
A.2 행렬의 합
A.3 행렬의 곱
A.4 행렬의 전치

APPENDIX B 로지스틱 회귀상에서의 톰슨 샘플링
B.1 베이즈 로지스틱 회귀
B.2 로지스틱 회귀 톰슨 샘플링

 

목차를 보면 아시겠지만 흥미로운 토픽들이 많습니다.

보시면 '베이즈 추론 기반 의사 결정'이 제일 흥미로운 토픽 같습니다.

베이즈 기반의 접근 방식이 요즘 핫하거든요.

하지만 내용이 좀 어렵긴 합니다. ㅋㅋ

아마 통계학을 잘 모르는 분들이시라면 마냥 읽기엔 어려움이 다소 있으실 거라 판단됩니다.


Q. 그럼 누구에게 추천하는 책인가요?

웹 최적화(Web Optimization)에 관심이 많거나 주업으로 삼고 계신 분들에게 최적화 성능을 높일 수 있도록 '머신러닝'이라는 핫한 주제를 도입한 책이므로 이에 관심이 있으신 분들에게 추천합니다.

특히 다음과 같은 주제에 관심이 많으신 분들에게 추천합니다.

● 베이즈 추론 기반 의사 결정
● 적은 양의 데이터를 활용해 효율적으로 가설 검증하는 방법, 선형 모델
● 통계 모델을 사용하지 않는 최적화 방법, 메타휴리스틱
● 다중 슬롯머신 문제(MAB)와 그 해법
● 베이즈 최적화로 대화형 최적화 문제 다루기
● 웹 최적화에서 해결되지 않는 문제들

 

아마 웹개발자 중 통계 베이스가 있으신 분들이 보셔야 할 겁니다.

사용되는 알고리즘 및 기법이 기초통계학 이상이기 때문이죠.

물론 챕터 4에서 통계 모델을 사용하지 않고 단순히 최적화 알고리즘만 사용하는 메타 휴리스틱에 대해서도 다루고 있습니다.

그럼에도 불구하고 전반적인 내용을 훑으시기 위해서는 통계 지식이 요구됩니다.

 


Q. 이 책의 장점은 무엇인가요?

머신러닝을 웹 최적화라는 낯선 분야에 도입했다는 것입니다!

통상 머신러닝이라고 하면 회귀 모형을 이용한 예측, 분류 모형을 이용한 분류 문제에만 관심을 갖게 되는데,

결국 머신러닝의 원리는 최적화에 기반하고 있거든요.

사실 여기서 다루고 있는 것도 머신러닝보다는 통계학에 좀 더 가깝지 않나 싶지만,

결국 머신러닝이 전산통계, 통계계산에 기반하고 있는 분야니깐요.

 

아무튼 웹개발을 하시는 분들 중 보다 획기적으로 웹페이지 설계를 시도해보고 싶으신 분들에게 추천하는 책입니다!

저도 기회만 된다면 해보고 싶을 정도네요.

 

감사합니다.

 

 


- 간토끼(DataLabbit)

- University of Seoul

- Economics & Data Science

 

728x90

+ Recent posts