[책 리뷰] 머신러닝을 활용한 웹 최적화

hanbit-ml_web_optimization-01

이 리뷰는 한빛미디어 <나는 리뷰어다=""> 활동을 위해서 책을 제공받아 작성된 서평입니다.

비즈니스를 하다보면 중요하면서도 관심있는 부분중 하나가 웹 최적화(ex> AB 테스트) 일 것이다. 이 책이 그 부분에 대해서 짚어주고 있으며 머신러닝을 배웠던 사람들이 흔히 접해봤을 법한 알고리즘을 활용해서 웹 화면에 어떻게 녹여낼 수 있을까를 알려주는 책이다.

책을 읽다보면 이미 많은 알고리즘을 공부해본 사람들은 쉽게쉽게 읽을 수 있지 않을까 싶다. 하지만 대부분의 일반적인 머신러닝 책들이 타이타닉, 붓꽃품종 등에 대한 기본적인 예시를 들면서 알고리즘에 초점을 맞추고 있다면 이 책은 웹 최적화에 대한 예시를 들어가면서 설명한다. 간단하게 말하자면 다른 머신러닝에서 설명하는 같은 알고리즘(베이즈정리, 샘플링 기법들, 가우스커널, 정규화 등)에 대해서 설명하지만 예시가 웹 최적화라고 생각하면 된다.

처음 챕터에서는 AB테스트, 즉 A 안과 B 안중에 어느 것이 좋은가를 베이즈정리를 활용해서 알려준다. 이미 알고 있는 사람들도 많겠지만 작성자의 경우 이 일은 회사에서 하고 있지 않기 때문에 다시 한번 상기시키면서 읽는데 도움이 되었다. 그리고 이 챕터에서 사용하지 않지만 참고로 알려주는 베타분포는 뒷장에서 이어서 계속 나오니 참고라고 생각하면 안되고 한번 읽어봐야 한다. 1장에서는 click vs non-click 을 비교했다면 2장에서는 조금 확장해서 리뷰점수와 같이 여러 요소가 있는 경우에 대해서 설명한다. 그 후 3장에서는 A 안 B 안은 각각 두가지의 요소로 섞여 있는데 이 요소 중 어떤 요소가 좋은지에 대해서 설명한다. 결국 2 x 2, 그 이상의 차원에서는 어떻게 선택해야 하는가에 대한 이야기이다.

4장은 조금 쉬어가는 페이지로 hill climbing 알고리즘, 유전자 알고리즘에 대해서 설명해준다. 확실히 통계적인 설명이 적게 들어가서 그런지 개인적으로는 가장 이해하기 쉬운 챕터였던 것 같다.

5장, 6장은 1장,3장 을 확장한 개념이다 5장에서는 A 안과 B 안을 따로 보여주는데 B 안이 더 좋다면 A 안을 보여준 고객을 잃는 것 아니냐? 는 의문에서 시작해서 그러면 테스트할때마다 최적화해서 B 안을 더 보여주게끔 하는 방법을 설명해준다. 이제 여기서 많이 들어봤던 소프트맥스 샘플링, 톰슨샘플링 기법 등에 대해서 설명해준다. 6장은 여기서 3장을 합친 개념(요소가 많다.)을 설명해준다. 그리고 7장에서는 이제 연속적인 값들에 대해서 설명하면서 가우스커널 등에 대해서 설명해주고 8장에서는 마무리를 짓게 된다.

머신러닝 책을 이것저것 읽어보긴 했지만 평상시에 봐왔던 예시가 아닌 실제적으로 작성자가 관심있는 부분에 대해서 알려주니 흥미있게 읽을 수 있었던 것 같다. 하지만 개인적으로 생각해봤을때는 전문가라면 기초적인 이야기가 아닌가 싶은 느낌이 들었다. 결국 심화된 알고리즘을 알려주는 것이 아니라 기본적인 부분들을 활용해서 예시에 적용하는 방법을 알려주고 있기 때문이다.

그래서 전문가보다는 작성자처럼 웹 최적화에 대해서 궁금한 사람들에게 추천하고 싶다.