hanbit-sql_for_data_analysis

이 리뷰는 한빛미디어 나는 리뷰어다 활동을 위해서 책을 제공받아 작성된 서평입니다.

요즘엔 많은 회사들에서 데이터 분석을 진행하는데 기초적으로 알아야 할 프로그래밍 언어가 python 이라면 데이터베이스 언어중에 가장 기초적으로 알아야 할 언어는 SQL 이다. 또한 분석가가 아니라더라도 작성자처럼 백앤드 위주로 개발하는 사람이라면 매일처럼 사용하는 것이 아마도 SQL 일 것이다. 이 책은 SQL 을 활용해서 데이터 분석하는 방법에 대해서 알려주는 기본서이다.

SQL 도 정말 어려운 분야중 하나기 때문에 이를 공부하기 위해서는 많은 서적을 보아야 한다. 특히나 개발자들이나 DBA 들에게는 DBMS 자체를 공부해야 하기도 하는데 분석가에게는 필요할지는 아직 모르겠다. 그런 의미에서 보면 이 책은 분석가를 위해서 깔끔하게 필요한 것들 위주로 쓰여져 있는 책이 아닌가 싶다.

책에서는 처음에는 SQL 문법에 대해서 알려주면서 기존의 데이터를 가지고 분석을 위한 데이터로 어떻게 변형해야 할지 간단한 기법들을 설명해준다. 프로파일링을 통해 어떤 데이터를 가져와야 하는지 알아보고 이러한 데이터를 가지고 정제 및 체계화 하는 방법에 대해서 알려준다.

그리고 그 다음장인 3장 부터는 실제 정제되어 있는 데이터를 이용해서 여러 분석 방법론들을 설명한다. 사실 분석 방법 자체는 많이 들어봤던 방법이겠지만 데이터들을 sql 을 이용해서 분석을 한다는 점이 특별하다면 특별하다고 할 수 있을 것 같다. 시계열분석, 코호트 분석, 텍스트 분석 등 일반 개발자도 들어봤을 법한 분석 방법론인데 이를 sql 로 가져오고 보여주는 것이 신기했다. 8장에서는 여러 다른 DB 책에서도 자주 볼 수 있는 SQL 실행순서, 서브쿼리, DB 프라이버시 등에 대해서 간략하게 이야기하고 끝을 낸다.

개인적으로는 pandas 나 tensorflow 등 여러 프레임워크를 실무에서 써본적이 없어서 오히려 sql 만으로 분석을 하고 실습을 할 수 있어서 재미있게 느껴졌다. 또한 지금 현재 다니고 있는 스타트업처럼 작은 기업에서는 굳이 여러 다른 프레임워크를 쓸 필요 없이 sql 만으로도 간단한 분석을 할 수 있지 않을까 싶었다. 다만 완전히 DB 를 처음 접하는 사람들에게는 문법 자체가 생소할 수도 있지 않을까 싶어 기초는 한번 보고 이 책을 보는게 어떨까 싶다. 그래서 작은 스타트업 개발자인데 분석을 해보고 싶은 요구사항이 있다면 이 책을 참고해보면 좋을 것 같다.