Data Analytics

Big Data라 부르든, Data Science라 부르든, Data를 분석해서 Insight를 얻고자 하는 것이 우리의 목적이다. 저자의 말을 빌리면, 이런 부류의 책들은 크게 2종류로 나눌 수 있는데, 하나는 허공에서 뜬구름 잡는 부류가 있으며, 또 다른 부류는 수학기호로 가득한 학술서적이라는 것이다. 해당영역 전공자가 아니지만 이 영역을 궁금해하는 일반인들로서는, 학교 다닐 때도 잘 보지 않던 서적을 펴 놓고, 수학기호들과 씨름하고 싶지 않겠지만, 알맹이라고는 하나도 없이 그저 좋다는 이야기만 반복하는 그저그런 책들도 지겨울만 할 것이다. 이 책은 바로 딱 그 중간, 중간계에 있는 책이다. 저자가 추구했던 깊이와 내용도 바로 이 중간계였다.

이 책에서는 Data Mining의 기법과 응용분야를 다루고 있는데, Data Mining 기법들에 대해 수학기호를 하나도 쓰지 않고, 어떤 원리로 어떻게 접근하고자 한 것들이며, 장점은 무엇이고, 단점은 무엇인지, 해당분야의 유명한 알고리즘에는 무엇이 있는지 등을 아주 쉽고, 재미있게 잘 설명해주고 있다. Data Mining 기법들별로 하나의 Chapter를 할당해서 설명해주고 있다.

참고로, 이 책에서 다루고 있는 Data Mining 기법들 중 정형화된 데이터에 대한 Mining 기법들로는 Decision Tree, Regression, Artificial Neural Network, Cluster Analysis, Association Rule Mining 이 있다. 비정형 데이터에 대한 Mining 기법들로는 Text Mining, Big Data를 다루고 있는데, 비정형 데이터를 어떻게 정형화시킬 것인가와 관련된 문제들을 재미있게 설명해주고 있다.

이 외에도 Open Source 인 Weka, R을 이용해서 어떻게 Data Mining을 하는지는 별도의 Appendix에 담아 설명해주고 있다. 학생들이라면 가볍게 읽을 수 있는 입문서가 될 것이고, 직장인들이라면 유행처럼 사용되는 이 단어들 밑에 숨겨져있는 내용이 무엇인지를 파악해보고, 관심분야에 따라 한 단계 더 파고 들어가는데 있어서 좋은 길잡이가 될 수 있는 책이라고 생각한다. 이 분야에 관심있으신 일반인들에게는 강추이다~

(출처: Amazon)

댓글

이 블로그의 인기 게시물

멕시코 칸쿤 - 여행 오실 분들을 위한 팁 (1/2)

X의 즐거움

LA Hollywood Walk of Fame (헐리우드 명예의 거리) - 손도장 발도장 구경하기