메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

한빛랩스 - 지식에 가능성을 머지하다 / 강의 콘텐츠 무료로 수강하시고 피드백을 남겨주세요. ▶︎

머신러닝 실무 프로젝트

실전에 필요한 머신러닝 시스템 설계, 데이터 수집, 효과 검증 노하우

한빛미디어

번역서

절판

  • 저자 : 아리가 미치아키(有賀 康顕) , 나카야마 신타(中山 心太) , 니시바야시 다카시(西林 孝)
  • 번역 : 심효섭
  • 출간 : 2018-06-05
  • 페이지 : 228 쪽
  • ISBN : 9791162240816
  • 물류코드 :10081
  • 개정판정보 :개정판이 새로 출간되었습니다. 개정판 보기
  • 초급 초중급 중급 중고급 고급
4.2점 (6명)
좋아요 : 12

실전에 필요한 머신러닝 시스템 설계, 데이터 수집, 효과 검증 노하우 

 

머신러닝 알고리즘처럼 다른 책에서도 많이 다루는 주제 대신, 이 책에서는 “실무에서는 어떻게 해야 하지?”라는 궁금증을 해결하는 데 집중한다. 1부에서는 머신러닝 프로젝트를 처음 시작하는 방법, 시스템 구성법, 학습용 데이터 수집, 효과 검증에 필요한 저자들의 노하우를 알려준다.  2부에서는 저자가 엄선한 세 가지 프로젝트를 따라 해보며 실무 감각을 키울 수 있도록 구성했다.

 

주요 내용

1부. 머신러닝 실무 노하우

 - 머신러닝 프로젝트 처음 시작하기

 - 머신러닝으로 할 수 있는 일

 - 학습 결과 평가하기

 - 기존 시스템에 머신러닝 통합하기

 - 학습 데이터 수집하기

 - 효과 검증하기

 

2부. 머신러닝 실무 프로젝트

 - 프로젝트 1 : 영화 추천 시스템 만들기

 - 프로젝트 2 : 킥스타터 분석하기

 - 프로젝트 3 : 업리프트 모델링으로 마케팅 효율 높이기

아리가 미치아키(有賀 康顕) 저자

아리가 미치아키(有賀 康顕)

 

전자 회사의 연구소와 레시피 서비스 회사를 거쳐 지금은 Cloudera 소속의 필드 데이터 과학자다. 데이터 활용과 머신러닝 지원 업무를 담당한다. 소프트웨어 개발자로 머신러닝을 이용하기 위한 플랫폼과 고객 데이터 플랫폼을 개발하고 있다.

 

- https://twitter.com/chezou

- https://www.slideshare.net/chezou

- https://chezo.uno/

 

 

 

나카야마 신타(中山 心太) 저자

나카야마 신타(中山 心太)

 

일본 최대 이동통신사의 연구소, 소셜 게임 개발사, 머신러닝을 활용한 웹 마케팅 프리랜서를 거쳐 지금은 (주)Next Int를 창업했다. 자사 서비스 개발 외에도 게임 기획과 머신러닝 기획을 수행한다. 머신러닝 게임 디자인, 사업 설계, 신규 사업 기획 등을 두루 진행한다.

 

- https://twitter.com/tokoroten

- https://www.slideshare.net/TokorotenNakayama

- https://medium.com/@tokoroten/

 

 

니시바야시 다카시(西林 孝) 저자

니시바야시 다카시(西林 孝)

 

독립 SIer 소프트웨어 벤더를 거쳐 지금은 (주)VOYAGE GROUP 소속 소프트웨어 엔지니어다. 인터넷 광고 서비스 전달 로직을 개발한다.

 

- https://twitter.com/hagino3000

- https://hagino3000.blogspot.jp/

- https://speakerdeck.com/hagino3000

 

 

심효섭 역자

심효섭

연세대학교 문헌정보학과를 졸업하고 모교 중앙도서관과의 인연으로 도서관 솔루션 업체에서 일하면서 개발을 시작했다. 네이버에서 웹 서비스 개발 업무를 맡았으며, 웹 서비스 외에 머신러닝 공부도 꾸준히 하고 있다. 최근 관심사는 회사에 속하지 않고 지속 가능한 삶이다. 옮긴 책으로는 『돈 되는 파이썬 인공지능 프로그래밍』(위키북스, 2021), 『처음 시작하는 딥러닝』(한빛미디어, 2020), 『파이썬으로 시작하는 컴퓨터 과학 입문』(인사이트, 2017), 『도메인 주도 설계 철저 입문』(위키북스, 2020) 등이 있다.

 

1부. 머신러닝 실무 노하우

 

1장. 머신러닝 프로젝트 처음 시작하기

1.1 머신러닝은 어떻게 동작하는가 

1.2 머신러닝 프로젝트의 과정 

__1.2.1 문제 정의하기 

__1.2.2 머신러닝을 사용하지 않는 방법 검토하기 

__1.2.3 시스템 설계하기 

__1.2.4 알고리즘 선택하기 

__1.2.5 특징, 정답 데이터, 로그 설계하기 

__1.2.6 데이터 전처리 

__1.2.7 학습 및 파라미터 튜닝 

__1.2.8 시스템에 통합하기 

1.3 운영 시스템에서 발생하는 머신러닝 문제 대처 방법 

__1.3.1 사람이 작성한 황금기준을 사용하여 예측 성능 모니터링 

__1.3.2 예측 모델을 모듈화하여 알고리즘에 대한 A/B 테스트 수행 

__1.3.3 모델 버전관리를 통한 자유로운 롤백 

__1.3.4 데이터 처리 파이프라인 저장 

__1.3.5 개발 시스템과 운영 시스템의 언어 및 프레임워크 일치 

1.4 머신러닝 시스템을 성공적으로 운영하려면 

1.5 정리 

 

2장. 머신러닝으로 할 수 있는 일

2.1 머신러닝 알고리즘 선택 방법 

2.2 분류 

__2.2.1 퍼셉트론 

__2.2.2 로지스틱 회귀 

__2.2.3 서포트 벡터 머신 

__2.2.4 신경망 

__2.2.5 k-최근접 이웃 

__2.2.6 결정 트리, 랜덤 포레스트, GBDT 

2.3 회귀 

__2.3.1 선형 회귀의 원리 

2.4 군집화와 차원 축소 

__2.4.1 군집화 

__2.4.2 차원 축소 

2.5 그 외 

__2.5.1 추천 

__2.5.2 이상 탐지 

__2.5.3 패턴 마이닝 

__2.5.4 강화 학습 

2.6 정리 

 

3장. 학습 결과 평가하기

3.1 분류 결과에 대한 평가 행렬 

__3.1.1 그냥 정확도를 사용하면 될까? 

__3.1.2 데이터 분포가 치우친 경우를 위한 지표 - 정밀도와 재현율 

__3.1.3 균형 잡힌 성능을 평가하는 F-점수 

__3.1.4 혼동행렬 따라잡기 

__3.1.5 다중 클래스 분류의 평균 구하기 - 마이크로 평균과 매크로 평균 

__3.1.6 분류 모델 비교하기 

3.2 회귀 모델 평가하기 

__3.2.1 평균제곱근오차 

__3.2.2 결정 계수 

3.3 머신러닝 시스템의 A/B 테스트 

3.4 정리 

 

4장. 기존 시스템에 머신러닝 통합하기

4.1 기존 시스템에 머신러닝을 통합하는 과정 

4.2 시스템 설계 

__4.2.1 헷갈리기 쉬운 ‘배치 처리’와 ‘배치 학습’ 

__4.2.2 배치 처리로 학습 + 예측 결과를 웹 애플리케이션에서 직접 산출(예측을 실시간 처리) 

__4.2.3 배치 처리로 학습 + 예측 결과를 API를 통해 사용(예측을 실시간 처리) 

__4.2.4 배치 처리로 학습 + 예측 결과를 DB에 저장하고 사용(예측을 배치 처리) 

__4.2.5 실시간 처리로 학습 

__4.2.6 각 패턴의 특성 

4.3 로그 설계 

__4.3.1 특징과 훈련 데이터에 사용되는 정보 

__4.3.2 로그 저장하기 

__4.3.3 로그 설계 시의 주의점 

4.4 정리 

 

5장. 학습 데이터 수집하기

5.1 학습 데이터를 얻는 방법 

5.2 공개된 데이터셋이나 모델 활용 

5.3 개발자가 직접 만드는 데이터셋 

5.4 동료나 친구에게 데이터 입력을 부탁 

5.5 크라우드소싱 활용 

5.6 서비스에 수집 기능을 넣고 사용자가 입력하게 함 

5.7 정리 

 

6장. 효과 검증하기

6.1 효과 검증 

__6.1.1 효과 검증까지 거쳐야 할 과정 

__6.1.2 오프라인에서 검증하기 어려운 부분 

6.2 가설 검정 

__6.2.1 동전이 찌그러지진 않았을까 

__6.2.2 두 그룹의 모비율의 차를 이용한 검정 

__6.2.3 거짓 양성과 거짓 음성 

6.3 가설 검정에서 주의할 점 

__6.3.1 반복해서 검정하는 경우 

__6.3.2 유의한 차이와 비즈니스 임팩트 

__6.3.3 동시에 여러 가설 검정하기 

6.4 인과효과 추정 

__6.4.1 루빈 인과모형 

__6.4.2 선택 편향 

__6.4.3 무작위 대조시험 

__6.4.4 과거와의 비교는 어렵다 

6.5 A/B 테스트 

__6.5.1 그룹 선정과 표본 크기 

__6.5.2 A/A 테스트로 그룹의 균질성 확인 

__6.5.3 A/B 테스트를 위한 구조 만들기 

__6.5.4 테스트 종료 

6.6 정리 

 

2부. 머신러닝 실무 프로젝트

 

7장. 프로젝트 1: 영화 추천 시스템 만들기

7.1 시나리오 

__7.1.1 추천 시스템이란 

__7.1.2 응용 분야 

7.2 추천 시스템 제대로 알기 

__7.2.1 데이터 설계와 데이터 입수 

__7.2.2 명시적 데이터와 묵시적 데이터 

__7.2.3 추천 시스템의 알고리즘 

__7.2.4 사용자 기반 협업 필터링 

__7.2.5 아이템 기반 협업 필터링 

__7.2.6 모델 기반 협업 필터링 

__7.2.7 내용 기반 필터링 

__7.2.8 협업 필터링과 내용 기반 필터링의 장단점 

__7.2.9 평가 척도 

7.3 무비렌즈 데이터 분석하기 

7.4 추천 시스템 구현하기 

__7.4.1 인수분해 머신을 이용한 추천 

__7.4.2 인수분해 머신을 이용한 본격적인 학습 

__7.4.3 사용자와 영화 외의 정보 추가하기 

7.5 정리 

 

8장. 프로젝트 2: 킥스타터 분석하기 - 머신러닝을 사용하지 않는 선택지

8.1 킥스타터 API 찾아보기 

8.2 킥스타터 크롤러 만들기 

8.3 JSON 데이터를 CSV로 변환하기 

8.4 엑셀로 데이터 훑어보기 

8.5 피벗 테이블로 데이터 분석하기 

8.6 목표액 달성 후 취소된 프로젝트 살펴보기 

8.7 국가별로 살펴보기 

8.8 보고서 작성하기 

8.9 이 다음에 할 일 

8.10 정리 

 

9장. 프로젝트 3: 업리프트 모델링으로 마케팅 효율 높이기

9.1 업리프트 모델링의 사분면 

9.2 A/B 테스트를 확장한 업리프트 모델링 

9.3 업리프트 모델링에 사용할 데이터셋 만들기 

9.4 두 가지 예측 모델을 이용한 업리프트 모델링 

9.5 AUUC로 업리프트 모델링 평가하기 

9.6 실제 문제에 적용하기 

9.7 업리프트 모델링을 서비스에 적용하기 

9.8 정리 

 

현업 개발자를 위한 색다른 머신러닝 실무서 

 

머신러닝을 실제 시스템에 적용하려면 기존 이론서들에서는 다루지 않지만 꼭 필요한 지식이 적지 않다. 탐색적 분석에 대한 경험과 데이터 분석 업무를 수행하면서 경험적으로 익혀온 묵시적 지식 등이 여기 해당한다. 그래서 이 책은 머신러닝 프로젝트를 진행하는 과정을 따라 가며 실무자가 느낄 궁금증과 갈증을 해소해주도록 꾸몄다. 다른 입문서에서 다루는 머신러닝 알고리즘은 과감히 축약하고 노하우에 집중하여 얇고 경제적이다. 경험 많은 실무자라면 자신의 노하우와 비교, 정리하여 동료나 후임에게 전수해주는 모습도 아름다울 것이다.

 

머신러닝 알고리즘 입문서가 아닌 만큼, 머신러닝 초보자라면 다른 머신러닝 책으로 기초를 닦고 읽으면 저자들이 전하고자 하는 핵심이 더욱 잘 전달될 것이다.

  

추천사

“실제 머신러닝 시스템을 설계하는 방법을 폭넓게 설명하는 책이다. 7장 이후는 프로젝트를 통해 실제로 경험해보는 데 무게를 두고 있다. 머신러닝 기초를 익힌 후 읽으면 더 쉽게 이해될 것이다!”

_사이토, 아마존 독자

이론보다 실무에 중점을 둔 좋은 책입니다. 실무에서 딥러닝을 활요하기에 부담스러운 점이 몇가지가 있는데 다른 알고리즘도 활용하게 도와주는 좋은 책인것 같습니다.

이 책 목차를 보고 한 번 놀라고, 정말 목차 대로 내용이 나왔는지 확인하면 두 번 놀랐다. 모 쇼핑몰 쇼핑 어드바이저 챗봇을 구축하고 운영하면서 익히며 고민했던 경험과 사례가 이 책에 그대로 녹아 있었기 때문이다.


 1부. 머신러닝 실무 노하우
 - 머신러닝 프로젝트 처음 시작하기
 - 머신러닝으로 할 수 있는 일
 - 학습 결과 평가하기
 - 기존 시스템에 머신러닝 통합하기
 - 학습 데이터 수집하기
 - 효과 검증하기
 
2부. 머신러닝 실무 프로젝트
 - 프로젝트 1 : 영화 추천 시스템 만들기
 - 프로젝트 2 : 킥스타터 분석하기
 - 프로젝트 3 : 업리프트 모델링으로 마케팅 효율 높이기

 

이 책은 228쪽으로 얇다. 이정도 분량에는 일장일단이 있다. 애초에 저자는 머신러닝 입문서가 아님을 밝혔다. 아예 코세라 강의를 듣거나 입문서를 먼저 보라고 추천한다. 코드 한 줄 한 줄을 상세히 설명하지 않는다. 대신 Github에 Jupyter Notebook 코드를 올려 두었다.

그렇다 해도 책을 휘리릭 읽으면 내가 뭘 읽었는지 머리가 뭐가 남았는지 모를 수 있다. 우선 책을 1회차 읽고, 2회차에는 꼭 실습환경을 꾸며서 실제로 소스 코드를 실행해 보면 좋겠다. 윈7 사용자는 VM으로 Linux 환경을 먼저 구성해야 하는 번거로움이 있다.

이 책은 적지 않은 부분을 모델 평가에 할당했다. 실제로 참 어려운 부분이다. 다른 머신러닝 책도 모델 평가에 대해 다뤘지만, 데이터를 학습과 테스트 용도로 나누는 기술에 대해 설명하고 끝나는 때가 많았다. 반면 이 책에서는 업리프트 모델링과 적용방안까지 언급하면서 저자가 했던 고민에 대해 알려주는 게 인상적이다.

PC 한 대만 쓸 수 있는 학생은 이 책의 진가를 다 알기는 힘들 듯싶다. 하지만 회사원인 머신러닝 입문자는 회사의 자원을 쓸 방법을 찾아서 이 책의 범위를 뛰어넘은 실습을 해보자. 실력이 일취월장함을 자각할 것이리라.

 

덧. 번역서로 생각하지 못할 정도로 자연스러웠던 게 기억에 남는다.

머신러닝 관련 프로젝트를 진행해 본 적은 없지만 현재 업무 상 필요하게 될 수 있겠다는 판단이 들어 꾸준히 틈나는 대로 관련된 글을 읽던가 조금씩 준비를 해 나가는 상황이었다.

 

책의 두께가 얇아 처음엔 이 얇은 책에 얼마나 유용한 정보를 담았을까 살짝 우려했지만 대략 70% 정도 읽어나가는 지금에 있어서는 매우 마음에 든다. 오히려 두껍지 않은 것이 마음에 들 정도.

 

업무 상 현재 머신러닝 프로젝트를 조금씩 준비해 나가는 과정에서 가장 어려움을 느끼는 것이 무얼 어떻게 어떤 step으로 시작해야 할까였다. 그런데 이 얇은 책을 한 번 읽어보니 이 책의 가이드대로 시작부터 정의해 나가서  무엇을 먼저 해야 하고 어떤 부분을 체크해야 할지 감이 잡히면서 Poc를 해 볼 수 있겠다는 자신감이 생겼다.

 

얇아서 별 부담도 되지 않는다. 책 제목에 들어있는 '실무'라는 단어가 그렇게 잘 어울릴 수가 없다.

 

책의 서론의 내용을 살짝 옮겨본다.

 

누구를 위한 책인가

* 머신러닝 입문서를 떼고 실무에 활용하려는 엔지니어

* 대학에서 배운 머신러닝을 제품에 적용하려는 주니어 엔지니어

더 자세히는 다음과 같다.

* 머신러닝 프로젝트를 시작하는 방법

* 기존 시스템에 머신러닝을 통합하는 방법

* 머신러닝에 사용할 데이터를 수집하는 방법

* 가설을 세우고 분석하는 방법

 

누구를 위한 책이 아닌가

* 머신러닝 이론과 알고리즘, 특히 딥러닝

* 프로그래밍 기초

* 미적분, 행렬, 확률 등 고등학교 수준 수학

그러므로 다음과 같은 사람에게는 적합하지 않다.

* 머신러닝 연구자

* 머신러닝 이론을 배우려는 사람

* 사이킷런이나 텐서플로 같은 머신러닝 프레임워크 사용법을 배우려는 사람

* 머신러닝 프레임워크를 구현해보고 싶은 사람

 

이미 머신러닝 프로젝트를 진행해 본 경험이 있는 전문가이거나, 사내에 그러한 분이 계신 곳에서야 이 책이 별 도움이 되지 않을 수도 있지만 지금의 나처럼 일단은 머신러닝을 적용해서 뭘 할 수 있을까. 그리고 직접 한 번은 해봐야 하는 상황의 개발자라면 매우 큰 도움이 될 수 있을 것이라고 생각한다.

전체적인 구성은 다음과 같다.  


1부. 머신러닝 실무 노하우
- 머신러닝 프로젝트 처음 시작하기
- 머신러닝으로 할 수 있는 일
- 학습 결과 평가하기
- 기존 시스템에 머신러닝 통합하기
- 학습 데이터 수집하기
- 효과 검증하기
2부. 머신러닝 실무 프로젝트
- 프로젝트 1 : 영화 추천 시스템 만들기
- 프로젝트 2 : 킥스타터 분석하기
- 프로젝트 3 : 업리프트 모델링으로 마케팅 효율 높이기


이 책의 저자도 서문에서 언급하는 것처럼 이 책의 난이도는 중급 혹은 그 이상이다. 전체적인 책의 맥락은 이론적으로 머신러닝을 활용하는 것보다는 이론을 넘어 지금까지 쌓아둔 이론을 적재적소에 활용하는 방향으로 구성되어 있다.  


따라서 이 책은 머신러닝에 입문하는 초보자, 학부생 수준으로는 다소 버거울 수 있다. 그렇기에 이 책을 읽기 전에 한빛미디어의 '밑바닥부터 시작하는 딥러닝'을 읽는 것을 추천한다. 본 도서와 그 방향이 다르지만, 상대적으로 쉽게 쓰였다는 점과 머신러닝의 한 분야인 딥러닝을 이해함으로써 보다 효율적으로 '머신러닝'이라는 학문에 접근할 수 있을 것이다.


위의 구성과 같이 1부에서는 '실무에서는 어떻게?'라는 초점에 맞춰 머신러닝 프로젝트를 진행하는 방법에 대해 설명한다. 2부에서는 이런 프로젝트 방법론을 바탕으로 프로젝트를 진행하게 된다. 따라서 이론을 갖춘 이가 1부의 프로젝트 진행 방법을 살펴보고 본격적으로 2부의 예제를 따라가며 머신러닝을 보다 효율적으로 이해한다.


마지막으로 이 책에 대해 필자 개인적으로 아쉬운 부분은 내용에 비해 편집과 그 구성이 부족하다고 느꼈다는 것이다. 특히 1부에서 전체적인 문맥 구성과 사용된 어휘가 일반적이지 않았다고 느꼈다. 원서를 그대로 옮겼다면 어쩔 수 없는 부분이지만, '린 스타트업' 혹은 '스크럼'에 기반하여 책을 서술하는 부분에서 해당 분야를 알지 못하는 연구원이나 이론보다 체험적으로 익힌 비전공자라면 다소 난해하게 다가올 것이라 생각하게 되었다.

이전에 읽은 '신경망 첫걸음' 책으로 신경망과 딥러닝 학습의 기초 개념을 익힌 나는 이제 부자가 될 수 있는 작은 가능성을 손에 넣었다. 

마치 이 느낌은 금요일 저녁에 로또 1,000원 어치를 구입하고, 다가올 장밋빛 미래에 대한 기대감에 심장이 두근거리는 느낌이랄까.

그런데, 대체 이걸로 나는 무얼 만들 수 있는 것인가. 'ㅅ') 아내와 강아지가 꿀잠 자고 있는 내게 허락된 이 황금 같은 새벽 시간에, 

나는 AI 로 무엇을 만들어야 일리x어 더콰x엇 처럼 너와 나의 연결고리 전혀 없었던 람보르기니를 몰아 볼 수 있는 것인가.

이것은 비단 나만 하는 고민은 아닐 것이다. 지식은 생겼는데, 뭘 만들어야 될지 잘 모르겠는거. 'ㅅ') 

이것은 마치 초, 중, 고등학교, 심지어 대학교 때까지 수학을 배우면서 교수님들과 하던 얘기가 떠오르는 그런 상황인 것이다. 

'교수님, 근데 수학 배워서 어디에 써먹나요?
응. 네가 졸업하고 취업하는데 써먹지.' // 아하 그렇구나. 'ㅅ') 교수님은 역시 대단해.

개발자에게는 실제 프로젝트를 수행하거나, 샘플 프로젝트에서 참고하며 얻는 경험/지식이 매우 중요하다. 

개발 과제들을 찾아 마주하고, 그 수행 과정을 살펴보며 한걸음씩 정진하다 보면 해당 분야의 기술에 익숙해져 있는 자신을 발견하게 되는 것이다. 

그러다가 재수 좋으면, 진정 만들고 싶은게 생기기도 한다. // '주객전도' 이지만, 고민만 하는 것보다 백배 낫다. 하지만, 물론 안 생길 수도 있다. 'ㅁ') 캬캬.

문제는 나 같은 머신러닝 문외한이, 머신러닝 실무 프로젝트의 과정을 어디서 참고해야 하는가. 'ㅅ')

 

machine-learning.JPG

// 아부지. 아들은 이 책으로 머신러닝 실무를 깨우치려 합니다.

 

한빛미디어는 영악하게도 개발자들이 겪는 이러한 프로젝트 과정 엿보기에 대한 갈증을 감지하고, 
이 책을 출판한 것임에 틀림없다. 

 

머신러닝 프로젝트의 과정을 전체적으로 설명하고
이 과정들 하나하나와 관련된 지식들을 한 단계씩 풀어 설명해나간다.

이후, 3가지 다른 종류의 '실무 프로젝트' 과정을 통해, 데이터 설계/수집 방법과 알고리즘 제작 방법/이론, 데이터 분석 과정과 작성된 보고서의 예시, 결론 도출과 서비스에 적용하는 과정을 두루두루 안내하고 있는데 개인적으로는 '추천 서비스 시스템' 이 어떻게 설계되는지 알고리즘을 살펴볼 수 있는 부분이 좋았다. 'ㅅ')!

실무보다 일단 머신러닝의 기초 개념들과 알고리즘 자체가 궁금하신 분들은 '핸즈온 머신러닝' 도서를 참고하는 방향으로 고고싱하시길. 
// 하지만, 이걸 언제 다 읽...

이 도서는 기존 머신러닝 관련 도서들보다는 얇은 두께로
본인처럼 '머신러닝 실무 프로젝트' 의 전체적인 흐름과 세부를 살펴보고 싶은,
낮은 베개를 선호하시는 분들과 궁합이 좋을 것이다. 'ㅅ') 후후.

 

.


장점; 읽어보면 실무를 해본 사람들이 썼다는 걸 알 수 있다. 이론도 설명하지만, 실제 경험에서 오는 설명이 굉장히 와 닿는다
장점이자 단점; 책이 두껍지 않기 때문에 읽는데 부담이 좀 덜 하지만 자세한 내용을 원하는 경우 약간 부족하다는 생각이 들 수 있다

Part I

1장

특히 ‘1.2.2의 머신러닝을 사용하지 않는 방법 검토하기'가 인상적이다. 실무를 해본 사람들과 이야기해보면 흔히 하는 이야기지만, 출간하는 책에서 이렇게 쓰는 걸 보기는 힘들다. 사용하는 방법의 장점을 더 부각시켜야 독자가 흥미를 갖고 책을 읽지 않겠는가. 하지만 이렇게 솔직하게 현실을 썼다는 점에서 오히려 믿음이 갔다.

2장

머신러닝의 주제에 대한 대-소 분류 및 개념 설명을 하는데, 정말 정신없이 지나간다. 나 같이 어설프게 아는 사람에게는 다른 책에서 봤던 개념에 대한 설명 정도로만 이해하고 지나가게 될 거 같긴 하지만, 정리가 잘 되어 있어 읽기 편하다.

3장

평가를 위한 개념을 설명한다. 정밀도 정확도 재현률이나 TP, TN, FP, FN은 언제나 봐도 헷갈린다. 마이크로-매크로 평균이란 건 처음 봤고, RMSE와 결정 계수는 이름만 아는 정도인데, 일단 읽으면서 아~ 이랬지 하고 넘어갔다. 아마 또 잊어버려서 나중에 다시 봐야겠지.

4장

내용은 간단하지만, 실무에서 여러가지 경험을 통해 문제를 겪었다는 걸 느낄 수 있었다. 꼭 머신러닝이 아니더라도 시스템 구성의 기본적인 부분에 대해 궁금한 사람에게는 도움이 될 수 있다. 특히 로그에 대한 내용은 정말 공감이 간다. 간단한 프로그램이 아닌 이상 시스템에서는 로그를 남기고 쉽게 추적할 수 있어야, 문제가 생기건 개선을 하건 필요한 정보로 활용할 수 있는데, 대규모 로그를 잘 설계해서 사용하기 쉽게 만들면서도 필요한 정보를 즉각 보는 일은 정말 어렵다. 이런 면에서 참고할 만한 이야기가 많아 좋았다.
다만 아무리 봐도 그림 4–1, 2, 3이나, 5, 6, 7은 같은 그림으로 보이는데, 색을 다르게 했는데, 책에서는 흑백이라 구분이 가지 않는 건지 잘 모르겠다. 다시 봐도 똑같은 그림으로 보이는데.

5장

업무에 적합한, 질 좋은 데이터를 만드는 건 사실상 돈을 써야만 한다. 즉 수작업이 필요하다.

6장

가설 검정 부분은 통계를 몰라 그냥 그렇구나 하고 넘어갔으며, A/B 테스트 부분은 역시 동감한다.

Part II

역자가 https://github.com/flourscent/ml-at-work 를 통해 잘 준비해둬서 따라하는 데 어려움이 없다. macbook에서 Anaconda Python 3.5.5로 실행했다.

설치

엄청나게 긴 라이브러리 설치 리스트 (중간 한 페이지 정도 생략)

실행

jupyter notebook에서 ch. 9 실행 결과

 

결제하기
• 문화비 소득공제 가능
• 배송료 : 2,000원배송료란?

배송료 안내

  • 20,000원 이상 구매시 도서 배송 무료
  • 브론즈, 실버, 골드회원이 주문하신 경우 무료배송

무료배송 상품을 포함하여 주문하신 경우에는 구매금액에 관계없이 무료로 배송해 드립니다.

닫기

리뷰쓰기

닫기
* 상품명 :
머신러닝 실무 프로젝트
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
머신러닝 실무 프로젝트
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
머신러닝 실무 프로젝트
구입처*
구입일*
부가기호*
부가기호 안내

* 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?

자료실

최근 본 상품1