파이썬 데이터 분석 입문
(Foundations for Analytics with Python)
클린턴 브라운리 저 | 한창진, 이병욱 옮김
한빛미디어
CHAPTER 1 파이썬 기초
__1.1 파이썬 스크립트를 생성하는 방법
__1.2 파이썬 스크립트 실행 방법
__1.3 명령 줄에서 유용한 팁 몇 가지
__1.4 파이썬 기본 구성 요소
__1.5 텍스트 파일 읽기
__1.6 glob을 이용해 다수의 텍스트 파일 읽기
__1.7 텍스트 파일 쓰기
__1.8 print 문
__1.9 연습 문제
CHAPTER 2 CSV 파일
__2.1 기본 파이썬 대 팬더스
__2.2 CSV 파일 읽고 쓰기(파트1)
__2.3 기본 문자열 파싱이 실패하는 경우
__2.4 CSV 파일 읽고 쓰기(파트2)
__2.5 특정 행을 필터링하기
__2.6 특정 열 선택하기
__2.7 연속된 행 선택하기
__2.8 헤더 추가하기
__2.9 여러 개의 CSV 파일 읽기
__2.10 여러 파일의 데이터 합치기
__2.11 파일에서 데이터 값의 합계 및 평균 계산하기
__2.12 연습 문제
CHAPTER 3 엑셀 파일
__3.1 엑셀 통합 문서 내부 살펴보기
__3.2 단일 워크시트 처리
__3.3 통합 문서의 모든 워크시트 읽기
__3.4 엑셀 통합 문서에서 워크시트 집합 읽기
__3.5 여러 개의 통합 문서 처리하기
__3.6 연습 문제
CHAPTER 4 데이터베이스
__4.1 파이썬 내장 모듈 sqlite3
__4.2 MySQL 데이터베이스
__4.3 연습 문제
CHAPTER 5 응용 작업
__5.1 대량의 파일에서 원하는 집합 찾기
__5.2 CSV 파일에서 카테고리별 통계치 계산하기
__5.3 텍스트 파일에서 카테고리별 통계치 계산하기
__5.4 연습 문제
CHAPTER 6 데이터 시각화
__6.1 matplotlib
__6.2 팬더스
__6.3 ggplot
__6.4 seaborn
CHAPTER 7 기술통계와 모델링
__7.1 데이터셋
__7.2 와인 품질 데이터셋
__7.3 고객 이탈 데이터셋
CHAPTER 8 스크립트 자동 실행 예약하기
__8.1 작업 스케줄러(윈도우)
__8.2 크론 유틸리티(맥 OS 및 유닉스)
CHAPTER 9 더 공부할 것들
__9.1 추가 표준 라이브러리 모듈과 내장 함수
__9.2 파이썬 패키지 인덱스(PyPI) 추가 모듈
__9.3 추가 자료구조
__9.4 더 공부해야 할 것들
최근 들어 Google, Facebook에서 작성한 Bigdata 관련 논문들을 많이 접할 기회가 있었다.
Graph theory, Data visualization, Web searching, Text processing 등 여러 주제들 접하게 되었는데, 이 때 발견한 책이 파이썬 데이터 분석 입문 도서이다. Bigdata에 대해 관심을 가지고 처음 공부를 시작하는 입장에서 기대를 많이 한 책이다.
결론부터 말하면, 나에겐 맞지 않는 책이다. 그 이유를 나열하자면,
Python 도서라기에도, Data 분석에 관한 책이라고 하기에도 제목과 맞지 않다. 처음엔 python 기초를 설명하고, 추후엔 데이터 분석보단, python을 이용해서 하나하나 시각화나 몇가지 예제를 따라해 보는 정도가 전부이다.
데이터 분석에 대한 기초적인 이론 (Graph 이론 등)에 대해 기대한 나에게는 맞지 않는 책이였다.
Data load에 굉장히 많은 페이지를 할애하고 있다. 분명 data를 나의 program에 load하는 것은 중요할 수 있다. 하지만 분석을 위해 CSV파일, 엑셀 파일, 데이터 베이스 등에서 데이터를 읽고 프로그램에 load 하는 정도의 설명이 100여 페이지 가량된다. 차라리 기본적으로 File I/O 등에 익숙한 python 사용자를 대상으로 책을 작성했다면, 좀 더 많은 내용을 포함 할 수 잇지 않았을까?
데이터 시각화는 matplotlib, pandas, ggplot 등 어느 python 도서에도 포함하고 있는 내용들을 설명하고 있는데, 데이터 분석에 관한 내용이나 이론의 설명은 부족하고, 예제 코드를 실행하여 결과만 눈으로 확인하는 정도의 내용밖에 없다.
제목과 달리 데이터 분석에 관련된 내용을 거의 책에 존재하지 않는다.
아쉽지만, 정말 분석 위주의 내용을 원한다면, Facebook, Google등의 논문을 살펴볼 것은 추천한다.
이 글은 한빛미디어의 도서 리뷰 활동으로 작성된 글임으로 참고 바랍니다.