도리의 블로그

[도서] 이것이 데이터 분석이다 with 파이썬 본문

데이터 과학

[도서] 이것이 데이터 분석이다 with 파이썬

도리 DoRi 2021. 5. 4. 20:12

 

 

 "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 


 

 

 

안녕하세요!

오늘은 데이터 분석 책 리뷰를 하겠습니다 :) 

이 책은 분류, 예측, 텍스트 마이닝 등 다양한 데이터 분석 방법을 다루고 있습니다. 

비트코인 시세 예측, 손흥민 연관 키워드 분석처럼 재미있는 실습 예제가 많아서 지루하지 않게 학습할 수 있는 책입니다. 

 

 

저는 분류나 예측에 대해서는 이미 지식이 있는 편이기 때문에,

그 부분 보다는 제가 잘 알지 못하는 텍스트 마이닝 부분에 집중하며 책을 읽었습니다. 

텍스트 마이닝도 다룬다는 점이 이 책에 장점이라고 생각합니다.

제가 접했던 다른 데이터 분석 책들 중에서는 텍스트 마이닝을 담지 않는 책들이 많았기 때문입니다.

 

 

특히 데이터 분석 입문 책에서 텍스트 마이닝은 잘 다루지 않는 경우가 많은 것 같습니다.

사실 그래서 텍스트 분석은 제게도 생소한 분야였기도 하구요. 

간단한 워드 클라우드를 그린 것 말고는 꼼꼼히 분석을 한 적은 없었던 것 같아요. 

이 책은 트위터 크롤링, 연관분석, 빈도분석, 불용어 처리 등 텍스트 데이터와 관련해서 필요한 분석과 전처리를 담고 있습니다. 

라인 바이 라인으로 친절하게 설명되어 있어서, 어렵지 않게 이해할 수 있었습니다. 

 

 

개인적으로 실제 업무를 할 때도 많은 도움을 받았습니다. 

텍스트 데이터 분석과 시각화를 맡았는데, 이 책에 수록된 코드를 많이 참고했습니다. 

그리고 무엇보다도 깃헙에서 코드가 제공되고 있어서 코드를 직접 손으로 치지 않아도 되었다는 점이 좋았습니다.

깃헙에 있는 설명으로도 충분히 이해할 수 있어서 굳이 직장에 책을 들고가지 않아도 되서 편했습니다 :) 

 

 

어느정도 데이터 분석을 배운 분들에게도 충분히 도움이 될 만한 책이라고 생각합니다.

흔히 말하는 예측, 분류 이외에도 시계열 분석, 텍스트 데이터 분석을 담고 있어서 이 부분을 보완하고 싶은 사람들에게도 좋은 자료가 될 것입니다. 

한 권 구비해두고 필요할 때마다 꺼내보아도 좋은 책일 것 같습니다 :)