메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

머신러닝 파워드 애플리케이션

아이디어에서부터 완성된 제품까지, 강력한 머신러닝 애플리케이션 구축 과정 배우기

한빛미디어

번역서

판매중

  • 저자 : 에마뉘엘 아메장
  • 번역 : 박해선
  • 출간 : 2021-09-06
  • 페이지 : 304 쪽
  • ISBN : 9791162244692
  • 물류코드 :10469
초급 초중급 중급 중고급 고급
4.9점 (16명)
좋아요 : 3

아이디어가 현실이 되는, 나만의 머신러닝 애플리케이션 구현하기

 

머신러닝 기반 애플리케이션을 설계, 구축, 배포하는 과정에 필요한 모든 기술을 설명하는 책이다. 초기 아이디어가 제품으로 개발되기까지의 과정을 머신러닝 에디터 예제 프로젝트를 통해 순서대로 배운다. 데이터 과학자, 소프트웨어 엔지니어, 제품 관리자가 머신러닝 애플리케이션을 단계별로 구현하는 데 필요한 도구와 실무에서 맞닥뜨리게 되는 도전 과제와 모범 사례를 살펴본다. 유용한 코드와 친절한 그림, 업계 리더와의 인터뷰를 통해 실용적인 머신러닝 개념을 터득해 본인만의 머신러닝 애플리케이션을 자신 있게 구현해보자.

 

 

대상 독자

  • 프로그래밍 경험과 머신러닝 기초 지식을 가진 누구나
  • 데이터 과학자, 머신러닝 엔지니어로 현업에 종사하는 개발자
  • 코딩은 모르지만 데이터 과학자와 함께 일해야 하는 직군

 

주요 내용

  • 제품의 목표를 정의하고 머신러닝 문제를 설정합니다.
  • 첫 번째 엔드투엔드 파이프라인을 빠르게 만들어 초기 데이터셋을 획득합니다.
  • 머신러닝 모델을 훈련, 평가하고 성능 병목을 해결합니다.
  • 제품 환경에 모델을 배포하고 모니터링합니다.

 

부별 요약

  • 1부: 아이디어를 머신러닝 문제로 표현하고 성능을 측정하는 방법을 배워 초기 계획을 세웁니다.
  • 2부: 첫 번째 파이프라인을 만들고, 초기 데이터셋을 탐색하고 시각화하는 법을 배웁니다.
  • 3부: 목표를 달성할 때까지 모델을 향상하는 방법을 살펴봅니다. 
  • 4부: 모델 배포 시 고려해야 할 부분과 배포 방식, 모니터링 전략을 다룹니다.

 

추천사

머신러닝에서 가장 어려운 부분인 문제 정의, 모델 디버깅, 배포를 건너뛰는 책은 너무나 많습니다. 하지만 이 책은 이런 문제에 초점을 맞춰 이야기를 풀어갑니다. 이 책을 읽으면 아이디어에 불과했던 프로젝트를 큰 영향을 발휘하는 애플리케이션으로 만들 수 있습니다.

_알렉산더 구드, Intuit 데이터 과학자

 

머신러닝 모델을 도입하는 방법, 잘못되기 쉬운 부분과 특별히 주의해야 할 사항에 대한 실용적인 조언을 찾고 있다면 바로 이 책이 답입니다. 10년 전에 이 책을 읽었더라면, 교훈을 찾아 헤매던 시간을 단축할 수 있었을 겁니다.

_루카스 텐서, 트위치 ML 수석 매니저

 

상세이미지700_머신러닝 파워드 애플리케이션.jpg

저자

에마뉘엘 아메장

수년간 머신러닝 기반 제품을 만들었고, 현재는 스트라이프(Stripe)에서 머신러닝 엔지니어링을 담당하고 있습니다. 그전에 인사이트 펠로의 AI 책임자로 150개 이상의 머신러닝 프로젝트를 이끌었습니다. 집카(Zipcar)의 데이터 과학자로 온디맨드 예측과 머신러닝 모델을 제품 환경에 배포하는 것을 돕는 프레임워크와 서비스를 만들었습니다. 파리쉬드(Paris-Sud) 대학교에서 AI 석사 학위를 받았고 동 대학교 대학원에서 엔지니어링 석사 학위를 받았습니다. ESCP에서 경영학 석사 학위를 받아 머신러닝과 비즈니스를 아우르는 배경지식을 가지고 있습니다.

역자

박해선

기계공학을 전공했지만 졸업 후엔 줄곧 코드를 읽고 쓰는 일을 했습니다. 텐서 플로우 블로그(tensorflow.blog)를 운영하고 있고, 머신러닝과 딥러닝에 관한 책을 집필하고 번역하면서 소프트웨어와 과학의 경계를 흥미롭게 탐험하고 있습니다. 『혼자 공부하는 머신러닝+딥러닝』(한빛미디어, 2020), 『Do it! 딥러닝 입문』(이지스퍼블리싱, 2019)을 집필했습니다. 『파이토치로 배우는 자연어 처리』(한빛미디어, 2021), 『머신 러닝 교과서 with 파이썬, 사이킷런, 텐서플로(개정 3판)』(길벗, 2021), 『딥러닝 일러스트레이티드』(시그마프레스, 2021), 『GAN 인 액션』(한빛미디어, 2020), 『핸즈온 머신러닝(2판)』(한빛미디어, 2020), 『미술관에 GAN 딥러닝 실전 프로젝트』(한빛미디어, 2019), 『파이썬을 활용한 머신러닝 쿡북』(한빛미디어, 2019), 『파이썬 라이브러리를 활용한 머신러닝(번역개정판)』(한빛미디어, 2019), 『케라스 창시자에게 배우는 딥러닝』(길벗, 2018), 『텐서플로 첫걸음』(한빛미디어, 2016)을 우리말로 옮겼습니다.

[PART I 올바른 머신러닝 접근 방법 모색]


CHAPTER 1 제품의 목표를 머신러닝 문제로 표현하기

1.1 어떤 작업이 가능한지 예상하기

1.2 머신러닝 에디터 설계

1.3 모니카 로가티: 머신러닝 프로젝트의 우선순위 지정하기

1.4 마치며

 

CHAPTER 2 계획 수립하기

2.1 성공 측정하기

2.2 작업 범위와 문제점 예상하기

2.3 머신러닝 에디터 계획하기

2.4 규칙적인 향상 방법: 간단하게 시작하기

2.5 마치며

 

 

[PART II 초기 프로토타입 제작]


CHAPTER 3 엔드투엔드 파이프라인 만들기

3.1 가장 간단한 프로토타입

3.2 머신러닝 에디터 프로토타입

3.3 워크플로 테스트하기

3.4 머신러닝 에디터 프로토타입 평가

4.5 마치며

 

CHAPTER 4 초기 데이터셋 준비하기

4.1 반복적인 데이터셋

4.2 첫 번째 데이터셋 탐색하기

4.3 레이블링으로 데이터 트렌드 찾기

4.4 데이터를 활용한 특성 생성과 모델링

4.5 로버트 먼로: 데이터를 찾고, 레이블링하고, 활용하는 방법

4.6 마치며

 

 

[PART III 모델 반복]


CHAPTER 5 모델 훈련과 평가

5.1 가장 간단하고 적절한 모델

5.2 모델 평가: 정확도를 넘어서

5.3 특성 중요도 평가

5.4 마치며

 

CHAPTER 6 머신러닝 문제 디버깅

6.1 소프트웨어 모범 사례

6.2 데이터 흐름 디버깅: 시각화와 테스트

6.3 훈련 디버깅: 모델 학습하기

6.4 일반화 디버깅: 유용한 모델 만들기

6.5 마치며 

 

CHAPTER 7 분류기를 사용한 글쓰기 추천

7.1 모델로 추천 만들기

7.2 모델 비교하기

7.3 추천 생성하기

7.4 마치며

 

 

[PART IV 배포와 모니터링]


CHAPTER 8 모델 배포 시 고려 사항

8.1 데이터 고려 사항

8.2 모델링 고려 사항

8.3 크리스 할랜드: 배포 실험

8.4 마치며

 

CHAPTER 9 배포 방식 선택

9.1 서버 측 배포

9.2 클라이언트 측 배포

9.3 연합 학습: 하이브리드 방법

9.4 마치며

 

CHAPTER 10 모델 안전장치 만들기

10.1 실패를 대비하는 설계

10.2 성능 설계

10.3 피드백 요청

10.4 크리스 무디: 데이터 과학자에게 모델 배포 권한 부여

10.5 마치며

 

CHAPTER 11 모니터링과 모델 업데이트

11.1 모니터링의 역할

11.2 모니터링 대상 선택

11.3 머신러닝을 위한 CI/CD

11.4 마치며

머신러닝 아이디어 생각만 하고 있었다면? 

지금 바로 애플리케이션 개발에 힘을 실어줄 강력한 한 방!

 

머신러닝이 점점 더 활발하게 다양한 제품에 사용되면서, 새로운 제품 개발에 대한 아이디어가 번쩍번쩍 샘솟는 분들이 많을 겁니다. 생각에만 그치지 않고 아이디어를 실제 애플리케이션으로 구현하고 싶은데 어떤 것부터, 어디서부터 시작해야 할지 모르겠다면 바로 이 책을 펼쳐보세요. 대부분의 머신러닝 책이 알고리즘과 라이브러리 설명에 중점을 두는 것과 달리, 이 책은 머신러닝 기반의 애플리케이션 아이디어가 실제 애플리케이션으로 구현되는 모든 과정을 살펴봅니다. 실무자가 실제로 애플리케이션을 구현할 때 필요한 도구와 마주하게 될 도전 과제를 살펴보고, 업계 리더 4명의 생생한 경험이 담긴 인터뷰를 통해 유용한 팁을 얻어 본인만의 스킬을 쌓아가세요. 이 책을 읽고 나면 본인만의 머신러닝 애플리케이션을 구현하는 과정의 첫 삽을 자신 있게 뜰 수 있을 겁니다. 

  • 머신러닝 파워드 애플리케이션은 머신러닝 모델을 장착한 실용적인 애플리케이션을 만드는 방법을 다루는 책입니다. 머신러닝의 도움을 받을 수 있는 실용적인 문제를 식별하고 이런 문제를 위해 성공적인 솔루션을 제공해주고 있습니다. 또한 고수준의 제품 목표에서부터 시작해 머신러닝을 활용해 결과를 만들어내는 도전적인 작업을 완수할 수 있도록 돕고 있습니다.

     

    이 책은 파이썬을 사용하기 때문에 파이썬에 대한 기본 문법을 알고 있으면 많이 도움이 됩니다. 또한 머신러닝 알고리즘의 내부 동작을 다루지는 않기 때문에 기본적인 머신러닝 개념을 알고 있다는 전제하에 씌여진 책이라고 보면 됩니다

     

    머신러닝 애플리케이션을 배포하기 위해서는 1. 올바른 머신러닝 접근 방법 모색, 2. 초기 프로토타입 제작, 3. 모델 반복, 4. 배포와 모니터링의 과정을 거칩니다. 이 책에서는 이 4단계의 과정을 모두 다루고 있습니다.

     

    1. 올바른 머신러닝 접근방법을 모색하기 위해 먼저 제품의 목표를 머신러닝 문제로 표현하는 방법에 대해 다룹니다. 또한 어떻게 계획을 수립하는지에 대해서 다루고 있습니다.

     

    2. 초기 프로토타입 제작하는 방법을 다루기 위해 엔드투엔드 파이프라인 만드는 방법과 초기 데이터셋을 준비하는 방법을 다룹니다.

     

    3. 모델 반복의 과정을 위해 모델 훈련과 평가, 머신러닝 문제 디버깅, 분류기를 사용한 글쓰기 추천에 대한 내용을 다룹니다.

     

    4. 배포와 모니터링 과정을 위해 모델 배포 시 고려 사항, 배포 방식 선택, 모델 안정장치 만들기, 모니터링과 모델 업데이트에 대해 다룹니다.

     

    300 페이지가 조금 안되는 분량에 많은 내용을 다루고 있습니다. 코드는 꼭 필요한 부분만이 포함되었고, 어려운 개념을 쉽게 설명하기 위해 그래프, 표, 그림을 많이 첨부하였습니다. 하지만 개발 환경을 다루는 부분과 기본적인 모델에 대한 알고리즘에 대한 내용을 다루지 않아 약간 아쉽습니다.

     

     

    "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

  •  

    옛 속담에 '구슬이 서 말이라도 꿰어야 보배'라는 말이 있는데, 인공지능 분야야 말로 이 말에 딱 맞는 예라 할 수 있다. CNN, GAN, LSTM, 미디어파이프 등 다양한 패턴이나 알고리즘에 대해 아무리 많이 알고 있다고 해도 이것들을 제대로 응용하지 못한다면, 아무 쓸모없기 때문이다. 

     

    하지만 그 응용 방법을 배울 기회가 적다는 근본적인 문제가 있다. 현재 인공지능 애플리케이션들이 많이 등장하고 있지만, 인공지능이 모든 프로그램에 적용되는 것이 아니다 보니, 인공지능 프로젝트에 참여할 기회가 많은 편은 아니다. 그리고 인공지능 분야는 경험에 따른 노하우 능력 차이가 워낙 커서 소위 초짜의 진입 장벽이 높다. 결국 해본 사람이 계속하게 되는 빈익빈 부익부 상태가 되고 있다. 

     

    실무 개발 기회가 적다고 암울해질 필요는 없다. 다행스럽게도 에마뉘엘 아메장의 저서, '머신러닝 파워드 애플리케이션'을 통해, 누구나 머신러닝 애플리케이션 프로젝트에 함께하며 얼마든지 노하우를 쌓을 수 있는 기회를 얻을 수 있다.

     

    이 책은 머신러닝 프로그램 개발 처음부터 끝까지 모든 과정을 담았다. 사용자가 글을 더 잘 쓰도록 돕는 문장 추천하는 '머신러닝 에디터'를 개발하겠다는 단순한 아이디어 상태부터 시작해서, 이 개발 목표를 머신러닝 문제로 어떻게 표현할지 맨 먼저 검토해보고, 초기 계획에 맞춰, 가장 간단한 프로토타입을 만들어 본다. 그리고 데이터를 어떻게 구하고, 가공과 테스트는 어떻게 할지 점진적으로 구체화하며, 모델도 만들어 보고, 디버깅, 배포와 모니터링도 하며 머신러닝 애플리케이션을 완성한다. 

     

     

     

    전체적인 개발 과정을 보고 있으면, 저절로 애자일 개발방법론이 떠오른다. 머신러닝 애플리케이션 개발도 동일한 과정이 적용되는 것이다. 다만 기존에 프로그래밍 관련 책과는 다르게, '머신러닝 파워드 애플리케이션'에서는 파이썬 코드가 나오긴 하지만 코딩 자체 비중은 적다. (전체적인 코드 분석은 깃허브를 통해 독자가 스스로 해야 한다) 거의 대부분이 머신러닝 애플리케이션 실제 개발에 관련된 내용이다. 

     

    어떤 데이터가 유용한지, 데이터를 벡터화하고 군집 클러스터를 만들고 테스트하는 법, 학습 시에 발생할 수 있는 문제들, 어떤 사이트가 도움이 되고, 오픈 데이터, 오픈 소스 사용법, 방법에 따른 장점과 단점 등 기존의 인공지능 책에서 보지 못한 실무에 유용한 조언들을 가득 담고 있다. 심지어 저자의 경험 이야기만으론 부족했는지, 링크드인 외에 다양한 AI 전문 기업의 지인들의 견해와 노하우도 Q&A 방식으로 독자에게 알려주고 있다. 

     

     

     

    그리고 이것을 박해선 번역자도 제대로 한 몫 하며 거들고 있다. 곳곳에 옮긴이 주석을 달아서, 책 원본에 부족하거나, 추가로 설명하고자 하는 것들을 마구마구 담은 것이다. 역자의 이런 노고가 좀 더 완성도 높고, 독자에게 도움이 되는  '머신러닝 파워드 애플리케이션'을 만들었다 생각한다.

     

    그런데 '머신러닝 파워드 애플리케이션'은 인공지능 이론을 가르쳐 주는 책이 아니다. 어디까지나 실무 개발 방법을 다룬 책이다. 그만큼 쉬운 책이 아닌 것이다. 적어도 중급서 이상으로 파이썬은 기본으로 알고 있어야 하고, 인공지능에 관련된 지식도 갖추고 있어야 한다. 책 자체의 설명은 어렵지 않으나, 일반적인 수준의 머신러닝 관련 내용은 자세한 설명 없이 이야기하고 있으므로 모르는 부분이 있다면, 주석을 참고해서 일일이 찾아 볼 필요가 있다. 인덱스까지 포함 303쪽의 그리 많아 보이지 않은 분량의 책이지만, 저자가 참고하라는 거, 주석, 내가 모르는 파트 같은 거 다 찾아가며 보면, 절대 작은 분량이 아니다. 

     

     

     

    머신러닝 프로그램의 잘못된 결과는 데이터의 문제, 모델링의 문제, 학습의 문제 등에서 발생한다. 그렇기 때문에 저자는 아파트 임대 예약이나 환자 희귀 질병 예측 같은 예를 들어가며 발생할 수 있는 여러 조건과 문제 상황에 대해 말하고, 개선 또는 해결 방법을 말하고 있다. 

     

    인공지능 관련 책을 보면 다들 느끼겠지만, 인공지능은 1+1=2처럼 딱 떨어지는 게 아니고, 대충 2쯤 된다 그런 느낌을 받는다. 2가 정답이지만, 학습을 잘못하면, 3이나 1이 나와 잘못된 결과를 얻을 수 있는 것이다. (물론 연산을 인공지능으로 구현하진 않을 것이다. 그냥 예다.) 2라는 정답이 간단해 보여도, 인공지능에서는 이것을 제대로 도출하는 것이 개발자의 노하우이자, 능력인 것이다. 그러기 때문에 책에 나온 저자의 경험과 조언은 시행착오를 줄이고, 제대로 된 결과를 얻는데 많은 도움이 되는 것이다.

     

    '머신러닝 파워드 애플리케이션'처럼 실무 측면에서 머신러닝을 다룬 책은 이번에 처음 접한다. 실제 머신러닝 애플리케이션을 어떻게 개발하는지 확실히 엿보고 배울 수 있는 책이었다. 머신러닝 실무를 배운다는 생각으로 봐도 좋겠지만, 책 구성 상, 저자와 함께 프로그램을 한 단계 한 단계 올라가며 만들어 본다는 느낌으로 보면 더 현실감을 느끼며 볼 수 있을 거 같다. 이 책이 모든 머신러닝 작업에 표준이 되지는 않겠지만, 적어도 개인적으로는 머신러닝 프로그램을 개발하게 된다면, PC 옆에 두고, 자주 보며, 참고할 거 같다. 

  •  21세기의 연금술로 떠오른 ML이 현실적으로 적용된다면 이 책에서 소개하는 방법을 숙지하는 것도 좋다.

    책의 현업자들이 지적하는 대로 ML을 반드시 모든 분석 프로젝트와 앱 서비스에 넣어야 될 필요는 없다. 뭔가 그 연금술의 멋져보이는 면에 현혹되어 한 삽으로 뜨면 해결될 걸 굳이 포크레인으로 뜨는 무리는 하지 말자는 거다. 

    사실 ML은 요 근 몇 년간 이론 중심적으로 많이 홍보된 게 사실이다. 그걸 전공한 석박이 강의를 해서 그럴 수도 있지만 ML서비스를 만드는 것에 관심이 있는 사람이 그 모든 이론을 꿰고 연구급의 이해력을 갖춰야 되는 건 아니라고 본다. 그저.. 잘 만들어진 알고리즘을 잘 갖다붙이는 정도만 해도 될 것 같다(이게 쉽다는 건 아님). 

     

    그 유명한 박해선 님이 번역한 거라 그런지 옮긴이 특유의 주석이 많고 책을 이해하는 데 도움이 된다. 

    이젠 좀 나오는 책들이 현실적으로 DS, ML을 적용한 사례를 많이 보여줌. 그래서 좋다고 생각한다. 

     

    현실의 문제는 데이터를 '갖고오느냐!!'부터 시작한다. 저자도 이 부분을 언급하고 있음. 실제로 공장자동화 이런 부분은 데이터 협조도 안되는 경우가 많음. 갠적으론 그렇기 때문에 이런 전체적인 플로우로 데이터 분석 및 그 주변 작업? 을 소개하고 갈쳤으면 어떨까. 

    다음은 주요 내용 정리.

     

    머신러닝을 해결할 수 있는 문제는 무엇인가?

    - 완벽한 규칙이 존재하는 도메인은 ML을 사용할 필요가 없다. 예) 세금 앱

    - 명확한 논리가 존재하는 문제는 ML을 사용하지 않아도 된다.

    - 정답이 있는 지도 학습 -> 정답이 없는 비지도 학습의 경우 일부 현업자는 부정적인 의견을 공유한 적이 있다. 

     

    알고리즘을 구현하기 전에 할 것

    - 직접 알고리즘이 되어보기

    : 데이터를 사용하지 않고 사전 지식으로 원하는 답을 만드는 방법을 정의해보기

    -> 이렇게 하는 이유: 기준 모델을 빨리 구현하고 모델을 평가하는 척도로 사용하기 위해. 즉 부분에 매몰되지 않을 수 있음.

     

    ML 프로젝트에서 초점을 맞춰야 할 곳

    : 성능 병목. 간단한 모델부터 시작해서 전체 파이프라인 디버깅. 즉 목표 Y값이 간단하고 쉬운 단계부터 예측하는 모델로 시작해보는 거다. 의외로 많은 문제가 이런 간단한 모델에서 끝날 수도 있음

     

    전체 파이프라인 구축 후 성능 병목을 찾을 떄

    : 했다치고 결과 상상하기. 즉 이 프젝을 완료했을 때 내가 SNS나 기사에 어떻게 발표할 건지. 도움이 되었는지를 생각해보라. -> 배포에 필요한 노력을 낮추도록 인프라를 구축하는 게 도움이 됨. 

     

    raw data를 들여다보기

    : raw data를 들여다보는 것은 항상 옳다. 수동으로 읽어보기-> data literacy가 생각나는 대목.

     

     

     

     "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

  •  

    해당 책은 일반적인 딥러닝/머신러닝 학습 도서가 아닌 개발자/엔지니어들을 위한 책입니다.
    다양한 모델들을 만들고 살펴보는 것보다는 데이터 수집부터 서비스 개발까지 전체 파이프라인을 이해하고 실제 구축하는데 목적을 두고 있습니다.
    개인적으로는 데이터 엔지니어링 업무가 예정되어 있어 일독하면서 흥미롭고 재미있게 읽었고 많은 부분에 인사이트를 얻을 수 있어 의미있는 학습 시간이었습니다.
    데이터 개발자/엔지니어들을 위한 책이지만 협업 관계에 있는 분석가, 시스템 관리자들에게도 추천드리는 책입니다.

     

    1.jpg

     

  • 이 책을 읽기 위해 필요한 것!

    프로그래밍 능력, 파이썬 기본지식, 머신러닝 기본개념!

    초심자를 위한 책은 아니라고 생각한다.

    지금 까지 수많은(?) 책을 읽고 예제를 돌리고 데이터를 대입하며 ..

    어쩌라고!! 하고 좌절한 사람들에게 필요한 책이다.

    머신러닝의 기본인 데이터를 다루는 방법에 대하여 코딩과 함께 설명해준다.

    이 얼마나 친절한가?!

    머신러닝은 데이터와의 싸움이다. 올바른 데이터 셋을 구성하고 정제하고 테스트하고 다시 분석하는 무한 반복의 굴레의 어디쯤 원하는 결과가 있다.

    우린 이미 충분히 성능좋고 멋진 라이브러리가 많다.

    이젠 데이터에 충분히 집중해.볼 필요가 있다.

    이 책은 왜 좋은 데이터가 필요한지 어떻게 좋은 데이터를 만들고 사용하는지를 알려준다.

    What이 아닌 Why와 그 답인 How에 대한 친절한 지도서다.

    왜 결과가 원하는 것과 달랐는지 머리를 싸맸다면 이제 이 책을 읽고 원하는 데이터를 고르고, 이미 있는 데이터를 읽고 재활용 해보자 문제 해결을 위해 구체적으로 무엇을 해야하는지 잘 알려주고 있다고 생각한다.

  • Book_2.JPG

     

    머신러닝을 이용하여실용적인 애플리케이션을 제작하고자 하는 이들에게 좋은 지침이 될만한 책이 출간되었다. 바로 ‘머신러닝 파워드 애플리케이션 (원제:Building Machine Learning Powered Applications)’. 머신러닝의 인기만큼 머신러닝을 소개하고, 모델 만들고 훈련시키는 방법을 다룬 책들은 많지만, 머신러닝을 이용하여실제 애플리케이션을 구축하는 과정에 대해 제대로 설명하고 있는 안내서를 찾기는 쉽지 않다. 이 책은머신러닝을 이용한 애플리케이션을 만들고 배포하고자 할 때, 프로젝트의 진행에 따라 무엇을 고민해야할지에 대한 실용적인 가이드를 해주고 있다.

    저자에 따르면아이디어로부터 머신러닝 애플리케이션 배포를 하는 전체 과정은 다음의 4단계로 이루어진다고 한다.

    1.    올바른 머신러닝 접근방법 모색

    2.    초기 프로토타입 제작

    3.    모델 반복

    4.    배포와 모니터링

    첫 단계인 올바른 머신러닝 접근방법 모색에서는 제품의 목표를 달성하기 위한올바른 성공 기준을 설정하고, 적절한 초기 데이터셋과 모델을 찾는 것이 중요하다. 두번째 단계인 초기 프로토타입 제작은 모델링 작업에 앞서 머신러닝을 사용하지 않고 제품의 목표를 달성하는 엔드투엔드 프로토타입을 제작한다. 이 프로토타입은 최상의 머신러닝 적용방법을 결정하는 데 도움이 된다. 다음의모델 반복단계는 모델을 훈련하고 평가하면서 점진적으로오류를 분석하고 모델을 다듬어나가는 과정이다. 마지막 배포와모니터링단계는 학습된 모델을 이용하여 적절한 방식을 통해 배포하는 과정에 대한 것으로, 모델의 오류를 완화하고 모니터링하는 방법을 다룬다.

     이책의 전체적인 구성 역시, 저자가 제시한 4단계를 따르고있다. 각 단계에 필요한 내용과 개념을 보다 효과적으로 전달하기 위해,머신러닝 보조 글쓰기 애플리케이션인 머신러닝 에디터를만들어가는 과정을 담고 있다. 이 책의 예제로 등장하는 머신러닝 에디터는 사용자가 글을 더 잘 쓰도록돕는 시스템, 특히 더 좋은 질문을 쓰도록 도와주는 것을 목표로 한다.예제프로젝트를 통해 실전과 같은 고민을 해 볼 수 있고, 예제코드는 깃허브에서 받아볼 수있다.

    또한, 책의 전반에 걸쳐 머신러닝 전문가와의 인터뷰및 조언이 포함되어 있는데, 실제 애플리케이션을 구축하고 서비스하면서 얻은 다양한 노하우 및 실용적인충고를 담고 있다

     

    *한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

  • 20211024_120251.jpg

    좋은 책이란 어떤 책일까?
    나에게 도움을 주는 책일 것이다. 이번주에 그런 책을 읽었다. 머신러닝 책들이 요즘 많이 나와서, 읽어도 거기서 거기인 책들이 많았는데, 조금 더 넓은 시선에서 바라본 책이라서 마음에 들었다.
    그렇다고 어렵지는 않았다.
    누가 읽으면 좋을 책일까?
    머신러닝을 체계적으로 하나하나 설명해주는 책은 아니다. 그래서, 간단한 머신러닝 관련 책으로 입문한 사람부터 읽으면 좋겠다는 생각이다. 그래도 한번 즈음은 책 내용을 따라해본 초보에게 더 적합한 책이다. 물론 수많은 머신러닝을 모델을 만들면서 기존의 책에서 가르쳐준대로만 하고 있다면 좋은 인사이트를 받을 수도 있다.
    수식 같은 것이 있을까요?
    머신러닝, 딥러닝 책들을 보면 기본 수학 수식을 설명한 책들도 많다. 이 책에는 그런 것이 없다. 두려워할 필요가 없다. 

     

    머신러닝 기본 개념에 한두번 따라해본 사람이라면 누구나 쉽게 읽을 수 있도록 번역자가 잘 번역해주셨다. 번역자가 다년간 머신러닝쪽으로 워낙 유명하신 분이라, 이번 번역본도 완성도가 높다.
     

    20211024_120308.jpg

    그런데, 전체 이야기가 머신러닝 이야기이다. 그냥 보면 일반 머신러닝 책과 비슷해보인다.
    그럼, 이 책만의 특징으로, 어떤 이야기들이 덧붙여졌을까?
    머신러닝 전체 파이프라인에서 우리가 생각해볼 문제점들을 하나 하나 건들어준다.
    그 팁들이 머신러닝을 오래하다보면 어디선가 다 들어본 이야기일수도 있다.
    그래도 이번 기회에 한번 완독해보기를 바란다.
    왜냐하면 주말이면 되기 때문이다. 하루 반나절 정동면 빠르게 책을 스킵할 수 있다.

     

    대충 머신러닝에 대한 전체적인 그림을 잡고, 본인이 실제 진행하는 과정에서 한번 더 찾아보면 좋을 것 같다.
     

    20211024_120409.jpg

     

    책 전체를 관통하는 느낌은 44페이지의 가장 간단한 알고리즘이 되어보기이다.
    바빠서, 몰라서 매번 바로 자동화 작업으로 들어갔는데,
    수동으로 해결해보기에 고개가 끄덕여졌다. 
    수동으로,단순하게, 빠르게 반복이 저자의 큰 핵심 줄거리가 아닐까 생각해본다.

    이 책이 머신러닝 자체를 공부시켜 주는 책은 아니지만, 옆에 두고, 머신러닝 프로젝트 할 때마다 읽어보면 실패로 가는 많은 순간을 걸러낼 수 있을 것 같다는 생각이 든다.

     

     



    "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

     

    • 조금은 낚인 기분
      • 책을 중간쯤 넘어갔을 때 남은 페이지를 확인해보고 든 생각이다.
      • 사실 이 책의 출간 소식을 듣고, 제목만 보고 기대했던 내용은 이랬다.
        1. 웹/앱에 머신러닝을 탑재하는 방법
        2. 지속적인 학습으로 성능을 유지할 수 있는 파이프라인을 구축하고 운영하는 법
        3. 한 발 더 나간다면, 웹/앱 사용자 행동으로부터 데이터를 수집하는 법
      • 올해 맡은 업무 중 하나는 데이터 수집과 웹 배포.
      • 여기에 머신러닝 어플리케이션을 하나씩 얹을 계획이라 이런 실용서가 몹시 필요다.
      • 어쩌면 내 수요가 눈을 가려버렸는지도 모르겠다.
      • 하지만 이건 내 일방적인 기대였고, 책은 문제가 없다. 
      • 한편으로는 무게중심을 데이터에 놓는 것이 중요하다는 것을 다시 한번 깨닫게 해준다.

     

    • 이 책의 구성
      • 이 책은 머신러닝 애플리케이션을 개발하며 어떤 고민을 해야 하는지 체계적으로 알려준다.
      • 이 문제를 머신러닝으로 해결하는 것이 맞는지부터 시작해서,
      • 데이터를 어떻게 수집하고 처리할지,
      • 모델을 어떻게 훈련하고 평가하고 디버깅할지,
      • 그리고 무엇보다 MVP(minimum viable product)를 만들고 단계적으로 키워가는 법이 담겨 있다.

     

    • 머신러닝은 거들 뿐
      • 수록된 구루들의 인터뷰와 모범 사례를 보면 내가 3년 전 고민끝에 내린 결론을 다시 한번 확인하는 느낌.
        1. "생각을 잘 해야 한다" - 여기서 생각은 당면한 코드나 알고리즘이 아니다.
          • 문제 정의 자체가 제대로 되어야 하고,
          • 문제를 넓은 시야로 보면서 걸림돌을 찾아내야 하지만
          • 한편으로는 저 걸림돌을 제거하는데 시간을 투자해야 하나? 를 고민해야 한다.  
          • 손자병법에서는 싸우지 않고 이기는 것을 상선(上善)이라고 한다.
          • 코딩을 하지 않고도 문제를 푸는 길이 있다면 그 길로 가면 된다.
        2. "동작이 빨라야 한다" - 여기서 동작은 아이디어의 구현, 결국 대부분 코딩능력이다.
          • 아무리 아이디어가 좋아도 손발이 느리면 말짱 헛생각이다.
          • 특히 MVP로부터 진화시키는 과정은 수많은 시행착오를 당연시해야 한다.
          • 아이디어가 생기자마자 시스템에 옮기지 못하면 지연이 누적되는 건 피할 수 없다.
          • hwp, ppt를 붙들면 코딩을 못하고, 이 기간이 몇 주가 되는 건 순식간이다.
          • 본업과 무관한 자기만의 과제를 만들어 진행하는 것을 side project라고 한다.
          • 구글이 20% 시간을 투자하라고 푸시하는 대상이기도 하고, 데이터를 다루는 이들의 필수품이다.
          • 본업이 잠시 코딩을 놓아도 개인은 실력을 갈고 닦을 수 있고 아이디어와 인맥이 샘솟기 때문이다.
        3. "모니터링: 개념 탑재와 시각화 능력이 중요하다" - 길을 잘 가고 있는지를 확인해야 한다.
          • 피터 드러커의 명언, "측정할 수 없다면 관리할 수 없고 관리할 수 없으면 개선도 없다."이 있다.
          • 좋은 모델은 예측이건 분류건 일을 잘 하는 모델이다.
          • 좋은 모델을 만들려면 현재 모델을 개선시켜야 하는데, 어디를 개선할 지를 정확히 알아야 한다.
          • 그러자면 적절한 측정지표(metric)가 필요하고, 현황을 그림으로 그려야 한다.
          • 어떨 때 어떤 metric을 쓸 지는 개념에서 나오고
          • 적확한 시각화 방법을 선택하는 능력은 개념과 코딩 능력에서 나온다.
          • 황무지에서 길을 잃은 채로 열심히 가면 굶어 죽을뿐이다.
      • 이런 조건들이 갖춰진 뒤에야 머신러닝을 한다.
      • 머신러닝 파이프라인도 처음에는 최소한으로, 돌아가게만 짜고 필요에 의해 하나씩 붙인다.
      • 물론 텐서플로(케라스)나 파이토치같은 머신러닝 프레임워크 사용 능력도 코딩 기본기에 속한다.
      • 이 길을 가고 있는 사람이라면, 내게 부족한 것이 무엇인지를 끊임없이 묻고 파악해서 메워야 한다.

     

    • 숙제를 받은 느낌
      • "이 책을 따라서 하면 머신러닝 애플리케이션을 만들 수 있겠지"라는 기대를 가지고 읽기 시작했지만,
      • "이 책을 따라서 머신러닝 애플리케이션을 만들려면 참 많은 능력이 필요하구나"라는 사실을 깨달았다.
      • 지금 당장도 익숙치 않은 웹 애플리케이션을 만드느라 서버 구축과 관리부터 몸으로 배우는 중이다.
      • 그 중에서도 머신러닝의 핵심은 역시 데이터.
      • 이 책의 80% 가량이 데이터 이야기다.

     

    • 저자의 말에 깊이 공감하며 오늘도 데이터를 주무른다.
      • "대부분의 소프트웨어와 다르게 머신러닝 코드는 겉으로는 올바르게 작동하지만 완전히 잘못된 결과를 출력할 수 있습니다. 위와 같은 도구 - 일반 소프트웨어 품질 관리 도구 - 와 팁을 대부분의 머신러닝 코드에 적용할 수 있지만 일반적인 문제를 진단하는 데 충분하지 않다는 의미입니다. (...) 머신러닝 프로그램은 그냥 실행하는 것이 전부가 아니라 정확한 예측 결과를 만들어야 하기 때문입니다."
      • "데이터 작업을 재미있는 모델링을 하기 전에 수행해야 하는 따분한 일이라 생각하기 쉽습니다. 하지만 모델은 데이터에서 트렌드와 패턴을 추출하는 방법을 제공할 뿐입니다. 사용할 데이터가 모델이 예측하기 충분한 패턴을 담고 있는지 확인해야 합니다(그리고 두드러진 편향이 내재되어 있는지 체크해야 합니다). 이것이 데이터 과학의 핵심 작업입니다(사실 모델 과학자라고 부르지 않고 데이터 과학자라고 부르는 것을 보면 알 수 있습니다)."

     

    ※ 한빛미디어 2021 도서 서평단 "나는 리뷰어다"의 일원으로 도서를 제공받아 작성한 리뷰입니다.

  •  

    Author: 에마누엘 아메장 지음 / 박해선 옮김

    출판사: 한빛 미디어

    Score /5: ⭐️⭐️⭐️⭐️⭐️

    [이 책의 대상 독자]

    • 실제 머신러닝을 위한 싸이클을 전체적으로 배우고 싶은 분

    시중에는 많은 머신러닝 책이 있다. 그 중에서도 특정 알고리즘이나 특정 프레임워크에 초점이 맞춰져 있는 책이 많은 것도 사실이다. 그렇게 특정 프레임워크에 대한 부분을 읽고 나면 남는것은 생각보다 많지 않다.
    그런 의미에서 이 책을 보면 전체 사이클을 진행하면서 해당 과정을 이해할 수 있다.

     

    나는 머신러닝에 대해서는 초보자이므로 일단은 가벼운 마음으로 이 책을 보기 시작했다. 이 책에서 내가 느낀 부분은 
    해당 책이 '정말 친절하다' 라는 것이다. A에서 Z까지 가는 과정을 정말 상세하고도 이해하기 쉽게 풀어 냈다. 소위 술술 읽히는 책이 이 책이 아닐까 한다.

     

    이 책은 전체적인 머신러닝 사이클을 배울 수 있으므로 처음 배우는 사람이나 아니면 실무에서 고생하고 있는 실무자도 모두 하나의 레퍼런스로 삼기에 충분한 책이다.

     

    ※ 이 책은 한빛 미디어의 지원으로 작성된 글입니다

  • 프로그래밍 언어를 배우기 시작하면 보통 해당 언어로 “Hello World”를 출력해보면 접근하듯, 머신러닝을 처음 배우면 대부분 mnist의 숫자 분류나 iris 붓꽃 분류를 해보며 코드를 작성하기 시작한다. 그리고 여러가지 알고리즘과 모델에 대해 배우고 시행 착오를 거치며 하이퍼 파라미터 튜닝을 하곤 한다. 하지만 언제나 그렇듯 실제 업무에선 이 단계들만 신경쓰는 거 만으론 부족하다. (4대 천왕 중 한 명인 앤드류 응 교수의 발언 덕분에 좀 나아지긴 했지만) 여전히 많은 사람들에게 경시당하는 데이터 수집 및 라벨링부터, 지속적인 운영을 위한 배포와 모니터링까지 하나의 “application”으로 동작하기 위해 더 많은 단계를 신경써야 한다.

    이 책은 대부분의 사람들이 관심을 갖고 해보길 원하는 알고리즘과 모델에만 집중하지 않고 “application”의 관점에서 단계별로 어떤 부분을 신경써야 하는지 초보자들에게 알려주는 일종의 machine learning관점의 software engineering 책이라는 생각이 든다. 일부 사람들에게는 책의 분량에 비해 코드가 적어서 실망할 수도 있겠지만, 조교수로 시작해서 기업의 AI 책임자가 되면서 느낀 문제점 때문에 이런 전체적인 관점에서 머신러닝을 이야기하는 책을 쓰지 않았을까 하는 생각이 들었고, 개인적으로는 지금 재직하는 회사에서도 비슷한 문제를 가진 개발자들을 볼 수 있어서, 실무에서도 필요하고 도움이 되는 책이란 생각이 들었다.

    Ref.

    한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다

  • 평 및 발제

      올 한해 개인적으로 가장 관심이 많이 갔었고, 시간을 많이 보낸 분야가 있다면 머신러닝 (기계학습) 이다. 기계학습이 화자가 된지  10여년이 되어가고 있고, 최근 유행은 딥러닝, 인공지능이 주를 이루는 시대인데 나는 어찌보면 이 분야에서 한참을 뒤쳐저서 이제서야 기계학습을 배우고 있다. 그럼에도 불구하고 기계학습 분야에 대해서 학기 수업을 듣고 혼자서 코딩도 하며 간단한 문제를 풀어보기도 하고, 어려운 문제는 파이썬 전문가 지인의 도움을 받으면서 가까스로 기계학습을 배워가고 있다.

     

    그런 수고가 있었기에 본 책을 그나마 이해할 수 있었고, 대략적으로 어떤 내용들인지 갈피가 잡힌다. 그 전에는 그저 책 제목 만으로도 기피해야할도서 였다면, 지금은 기계학습의 응용분야가 어딘이지 생각하면서 보게 되니 그래도 내가 좀 변하긴 했다.

     

    본 책의 머리말에도 적혀있는데, 이 책은독자가 프고그래밍에 어느정도 익숙하다는 가정하에 쓰여져 있고, 제예재코드는 주로 파이썬을 사용하여 설명하고 있다. 파이썬과 R을 전문적이진 않지만 바이오 분야의 전공자로서 그나마 조금 다루고 사용해볼 수 있었따.

     

     

    차례 및 요약

    [PART I 올바른 머신러닝 접근 방법 모색]

    CHAPTER 1 제품의 목표를 머신러닝 문제내용 로 표현하기

    CHAPTER 2 계획 수립하기

    [PART II 초기 프로토타입 제작]

    CHAPTER 3 엔드투엔드 파이프라인 만들기

    CHAPTER 4 초기 데이터셋 준비하기

    [PART III 모델 반복]

    CHAPTER 5 모델 훈련과 평가

    CHAPTER 6 머신러닝 문제 디버깅

    CHAPTER 7 분류기를 사용한 글쓰기 추천

    [PART IV 배포와 모니터링]

    CHAPTER 8 모델 배포 시 고려 사항

    CHAPTER 9 배포 방식 선택

    CHAPTER 10 모델 안전장치 만들기

    CHAPTER 11 모니터링과 모델 업데이트

     

    이 책은 실용적인 머신러닝에 대해 다루고 있다. 검색엔진, 소셜 플랫폼 추천 시스템, 번역 서비스, 사진에서 얼굴 감지 시스템 등 다양하게 사용되고 있는 머신러닝을 배울 수 있고, 활용 예제코드가 수록되어 있다.

     

    머신서링의 전체 과정에 대해 이 책에서는 아래의 단계로 소개하고 있다. 

    1. 올바른 머신러닝 접근 방법 모색

    2. 초기 프로토 타입 제작.

    3. 모델 반복

    4. 배포와 모니터링

     

    머신러닝의 반복 루프는 분석, 접근방법 선택, 수현, 측정을 통해 이루어 진다.

     

    머신러닝에서는. 모델 파이프라인 성능이 나쁘다면 모델의 품질 때문인지, 버그 때문인지 알수 있는 가장 좋은 방법은 점진적인 방식을 따르는 것이며, 데이터 흐름부터 시작해서 훈련능력, 마지막으로 일반화 추론의 디버깅을 진행하는 것이다. 

     

    위와 같은 내용들이 다양한 예제들과 함께 실용적으로 쓰여진 책으로 머신러니에 대해 상당한 전문 지식이 있어야 소화가 가능한 책이다.

     


                       "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다." 

  • 머신러닝 파워드 애플리케이션

    지음에마뉘엘아메장 / 옮김박해선

     

    저자 에마뉘엘아메장은 한국어판 서문에서 데이터 과학자와 머신러닝 엔지니어가 이 분야에서 성공하는데 필요한 실용적인 기술을 배울 수 있도록 멘토링을 했었다.

    2년간의 멘토링을 마친 후 이 책 Building Machine Learning Powered Appliction(오라일러 2020)을 집필했다.

    멘토링을 하면서 머신러닝 모델의 작동방식 가르치는 과정은 많지만 머신러닝을 제품에 사용하는 방법에 초점을 맞춘 자료는 부족하다는 것을 깨닫고 멘토링 과정에서 배운 교훈을 실리콘밸리를 넘어더 많은 사람들과 공유하기 위해 이 책을 썼다고 했다.

    저자는 책 출간하고 1년후에 프랑스어중국어로 번역되고 한국어로도 번역되게 되었다며

    이 책에 담긴 도구와 조언이 다양한 사람들에게 유용하다는 사실에 정말 기쁘다며독자들의 의견과 질문이 있다면 언제든 연락 바란다고 했다.

    이 책은 저자가 말했듯이

         머신러닝을 사용해 실용적인 애플리케이션 만들기

         실용적인 머신러닝

         기술적이고 실용적인 사례연구

         실제 비즈니스 애플리케이션을 다루고 있다

     

    머신러닝 전체 과정을 다루고 있다.

    멘토링 과정의 경험을 통해 머신러닝 적용의 어려운 문제들을 해결하면서 터득한 4가지에 중점을 두고 있다.

     

    올바른 머신러닝 접근 방법 모색

    주어진 문제를 풀기 위한 최상의 방법은 성공기준가용 데이터문제의 복잡성과 같은 많은 요소에 따라 달라진다.

    이 단계의 목표는 올바른 성공기준을 설정하고 적절한 초기 데이터 셋과 모델을 찾는 것이다.

     

    초기 프로토 타입 제작

    모델링 작업을 하기 전에 먼저 앤드투앤드 프로토 타입을 만든다.

    이 프로토 타입은 머신러닝을 사용하지 않고 제품의 목표를 달성하는 것이 목적이다또한 최상의 머신러닝 적용방법을 결정하는 데 도움이 된다프로토 타입이 결정되면 머신러닝 필요성을 알수있고 모델 훈련을 위해 데이터 수집을 시작할 수 있다.

     

    모델 반복

    데이터 셋이 준비되면 모델을 훈련하고 단점을 평가할 수 있다이 단계의 목표는 오류 분석과 구현 사이를 오가며 반복하는 것이다.

    이 반복 루프와 속도를 높이는 것이 머신러닝 속도를 높이는데 최상의 방법이다.

     

    배포와 모니터링

    모델이 좋은 성능을 내면 배포를 위해 적절한 방법을 선택해야 한다.

    배포된 후에 예상치 못한 방식으로 종종 모델이 실패한다.

     

    이 책은 제시한 4가지를 중심으로 다양한 머신러닝 적용사례를 제시하고 문제해결의 어려웠던 부문을 잘 설명하고 있다.

     

    4차 산업혁명 시대를 맞이하여 산업계에서는 디지털 변환이 확산되고 있다금융마케팅제조 등의 산업현장의 디지털 혁신 과정에서 머신러닝 기술 적용이 늘어나고 있다.

    현재 머신러닝 개발에 종사하고 있는데 문제해결에 어려움이 있다면무엇이 문제인지 고민하지 말고 일독을 통하여 문제해결의 실마리를 발견할 수 있는 기회가 되기를 바란다.

    또한머신러닝 분야에 관심을 갖고 있다면 필독서로 추천한다.

     

     

     

    "한빛미디어 <나는 리뷰어다활동을 위해서 책을 제공받아 작성된 서평입니다."

  • 내용이 어렵지 않아서 쉽게 쉽게 읽고 넘어갈 수 있어서 처음 머신러닝 어플리케이션을 개발해보고 싶은 사람들에게 방향성을 제시해줄 수 있는 좋은 책이라고 생각됩니다.

  •  


    [도서 소개]

    머신러닝 기반 애플리케이션을 설계, 구축, 배포하는 과정에 필요한 모든 기술을 설명하는 책이다. 초기 아이디어가 제품으로 개발되기까지의 과정을 머신러닝 에디터 예제 프로젝트를 통해 순서대로 배운다. 데이터 과학자, 소프트웨어 엔지니어, 제품 관리자가 머신러닝 애플리케이션을 단계별로 구현하는 데 필요한 도구와 실무에서 맞닥뜨리게 되는 도전 과제와 모범 사례를 살펴본다. 유용한 코드와 친절한 그림, 업계 리더와의 인터뷰를 통해 실용적인 머신러닝 개념을 터득해 본인만의 머신러닝 애플리케이션을 자신 있게 구현해보자.


    [대상 독자]

    - 프로그래밍 경험과 머신러닝 기초 지식을 가진 누구나

    - 데이터 과학자, 머신러닝 엔지니어로 현업에 종사하는 개발자

    - 코딩은 모르지만 데이터 과학자와 함께 일해야 하는 직군 


    [주요 내용]

    - 제품의 목표를 정의하고 머신러닝 문제를 설정합니다.

    - 첫 번째 엔드투엔드 파이프라인을 빠르게 만들어 초기 데이터셋을 획득합니다.

    - 머신러닝 모델을 훈련, 평가하고 성능 병목을 해결합니다.

    - 제품 환경에 모델을 배포하고 모니터링합니다.


    [추천평]

    머신러닝에서 가장 어려운 부분인 문제 정의, 모델 디버깅, 배포를 건너뛰는 책은 너무나 많습니다. 하지만 이 책은 이런 문제에 초점을 맞춰 이야기를 풀어갑니다. 이 책을 읽으면 아이디어에 불과했던 프로젝트를 큰 영향을 발휘하는 애플리케이션으로 만들 수 있습니다.

    -알렉산더 구드(Intuit 데이터 과학자)


    머신러닝 모델을 도입하는 방법, 잘못되기 쉬운 부분과 특별히 주의해야 할 사항에 대한 실용적인 조언을 찾고 있다면 바로 이 책이 답입니다. 10년 전에 이 책을 읽었더라면, 교훈을 찾아 헤매던 시간을 단축할 수 있었을 겁니다.

    -루카스 텐서(트위치 ML 수석 매니저)


    [서평]

    머신러닝 파워드 애플리케이션은 머신러닝 기반 애플리케이션을 사용하는 목적과 만드는 방법 까지 배울수 있다. 파트 1에서는 올바른 머신러닝 접근 방법에 대해서 설명 하고 있다. 먼저 어떤 작업이 가능 한지 예상을 하고 작업 범위와 문제점에 대해서 예상을 하며 계획을 수립하는걸 배운다. 파트2에서는 초기 프로토타입 제작에 대해서 배웁니다. 먼저 End To End 파이프라인 만들기를 합니다. 가장 쉬운 프로토타입을 만들고 워크플로 테스트를 합니다. 초기 데이터셋을 준비하고 레이블링으로 데이터 트렌드를 찾고 데이터를 활용한 특성 생성과 모델링을 합니다. 파트3에서는 모델 훈련과 평가 그리고 머신러닝 문제 디버깅, 분류기를 사용한 글쓰기 추천 모델을 만드는걸 배웁니다. 파트4에서는 모델 배포시 고려되는 사항에 대해서 배우고 서버, 클라이언트 배포등 하이브리드 방법까지 학습 합니다. 마지막으로 모니터링과 머신러닝을 위한 CI/CD 모델 업데이트 구축하는 방법을 학습합니다.


    머신러닝 파워드 애플리케이션은 처음 아이디어에서 부터 머신러닝 애플리케이션 개발/배포까지 모든 과정을 배울수 있는 책으로 기존의 레거시 앱을 어떻게 머신러닝 애플리케이션으로 만드는지 굼궁한 독자라면 많은 가장 좋은 참고서가 될것이라 생각합니다.

     

     "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

  •  

    "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

    책을 읽기 전에

    머신러닝 관련 학습 경험이 거의 없는 상태로 입문서와는 거리가 먼 책을 수령하게 되어 약간 당황스럽기는 했지만, 책이 다루고 있는 전반적인 내용의 흐름을 바탕으로 서평을 작성하기로 했습니다.

    아이디어부터 애플리케이션 배포까지

    이 책의 모토는 아이디어에서 시작해 완성한 애플리케이션을 배포하는 단계까지 머신러닝 전체 과정을 다루는 것이라 생각합니다. 아이디어에 맞는 올바른 머신러닝 접근 방법, 초기 프로토타입 제작, 모델링 및 반복, 배포와 모니터링까지 넓은 범위의 내용을 순차적으로 다루고 있습니다.

    적절한 예제 프로젝트

    이 책에서는 개념을 설명하는 과정에서 '머신러닝 에디터'라는 머신러닝 기반 글쓰기 보조 프로그램 예제를 제작하는 방식을 활용합니다. 이를 통해 텍스트 데이터를 다루는 것에 익숙해질 수 있으며, 실용적인 제품을 만드는 과정을 직접 경험할 수 있습니다.

    다양한 조건을 고려한 범용적인 서술

    단순히 책에서 다루는 예제의 제작 환경만을 다루는 것이 아닌, 다양한 조건에서 어떠한 접근 방식을 취하는 것이 유리한지, 어떤 방향으로 모델을 작성하거나 학습을 진행해야 할 지 모두 고려하여 기술하고 있습니다.

     

  • 한줄평

    AI 장인이 되고 싶다면 읽어야 할 책으로 매우 적합하다. 머신러닝을 조금은 아는데 파이프라인 설계나 이런 부분에 있어 경험적으로 부족하다면 이 책은 그 길에 좋은 길잡이가 될 것이다. 저자의 깊고 다양한 경험, 그리고 ML의 권위자의 인터뷰로 꽉찬 이책은 부족한 경험을 채워주고 마치 선배가 AI를 잘가르쳐준다는 느낌을 준다.

    난이도

    이 책의 난이도는 중급에서 고급이다. 기본적인 머신러닝에 대한 이해도는 있어야 이 책을 제대로 수용이 가능하다.

    재질 / 쪽수 / 가격

    매트지 / 304 / 27000원

    장점

    일단 컬러라서 너무나 좋다. 책이 너무나 아름답다는 느낌을 준다.

    내가 책을 읽을 때 중요시 여기는 부분은 그거 어디 인터넷에서 퍼온글로 이루어진게 아닌 저자의 경험이 녹아들어가있는가이다.

    근데 이 책은 그부분에 있어서 완벽하다. 해당 글은 다음과 같다.

    - 경험적으로 해결책을 정의할 수 없는 문제에 적합한 시스템을 만들 때 특히 머신러닝이 유용하다.

    - 가장 좋은 방법은 기존의 결과를 이해하하고 재현해보는 것입니다.

     

결제하기
• 문화비 소득공제 가능

배송료 안내

  • 책, 아이템 등 상품을 1만원 이상 구매시 무료배송
  • 브론즈, 실버, 골드회원이 주문하신 경우 무료배송

무료배송 상품을 포함하여 주문하신 경우에는 구매금액에 관계없이 무료로 배송해 드립니다.

닫기

도서판매처

리뷰쓰기

닫기
* 도서명 :
머신러닝 파워드 애플리케이션
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
머신러닝 파워드 애플리케이션
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
머신러닝 파워드 애플리케이션
구입처*
구입일*
부가기호*
부가기호 안내

* 인터넷 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

* 한빛 웹사이트에서 구입한 도서는 자동 인증됩니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?

자료실