핸즈온 비지도 학습

lan***l2024-07-20

코드의 실행과정

초판1쇄 발행 2020년 07월 20일.

핸즈온 비지도 학습 책자를 구입하여 실행하면 에러가 발생하는 부분이 너무 많음.

버전 문제이거나, 모듈들이 업그레이드 되어서 문제이거나, 이 책자로는 현재(2024년 07월 20일)로는 학습이 불가한것 같아 문의를 드립니다.

연락 바랍니다: hbmc816@naver.com

byc3***l2020-08-24

손 안되고 코풀고 싶을때 비지도 학습 이책을 보라

[나의 한줄 추천사]

데이터의 복잡도가 높거나 레이블링 안되었을 때 비지도 학습을 통해서 자동 피처 추출 및 군집화(클러스터링) 할수 있다. 이때 이 책을 꺼내서 보면 된다.

[책을 구매한 이유]

지도학습의 레이블링의 노가다(?) 성을 느낀 이후 스마트한 방법을 찾기 위해서 무조건 봐야함

[내가 찾고자 했던 질문과 대답들]

-비지도 학습으로 어떤것을 할수 있나?

1. 레이블 미지정 자동지정 (클러스터링)

2. 과대적합 해결 (문제를 복잡성을 줄여서 정규화 시켜줌 - 피쳐 추출)

3. 수많은 피처 축소 (차원의 저주 해결-차원감소)

4. 피처 엔지니어링 (적절한 피처 찾아줌)

5. 데이터 드리프트 ( 현재 데이터가 훈련셋과 얼마다 다른지 평가를 통해 재학습 여부 판단 가능)

- 지도학습과의 명백한 다른 관점은?

예측하는 대신 데이터의 내재된 구조를 학습한다.

비지도 학습의 자세한 알고리즘은?

- 차원 축소 알고리즘 : PCA ,LDA

- 클러스터링 알고리즘 : K-means 클러스터링

- 피처추출 알고리즘 : 오토인코더

- 비지도 딥러닝 알고리즘 : GAN

비지도 학습의 실제 적용된 성공적인 사례들은?

- 이상치(outlier) 탐지 : 신용카드 사기 등 사기 탐지에 사용됨

- 그룹 세분화(클러스터링) : 문서 분류 및 행동 유사성에 따라 그룹을 묶을 수 있는 마켓팅

비지도 학습의 만능인가?

- 지도 학습은 이미 알려진 패턴을 높은 수준의 정확도로 찾는 반면 비지도 학습은 흥미로운 새로운 패턴을 발견한다. 비지도 학습된 모델은 이러한 패턴을 발견하면 사람이 레이블을 지정하여 레이블이 지정되지 않은 데이터를 레이블이 지정된 데이터로 더 많이 전환시킬수 있습니다. 둘다 사용하면 결국 더 강력한 머신러닝 솔류션을 구축할수 있다

yong***l2020-08-24

제대로된 비지도 학습의 시작~!

우리는 데이터가 넘쳐나는 세상에 살고 있다.

그래서인지 몰라도 빅데이터, 데이터 사이언티스트, 시각화 분석 등등 데이터와 관련된 이야기가 사회적으로나 산업적으로나 화두다. 그리고 최근 몇년간은 아마도 머신러닝/딥러닝이 이들의 중심에 있는듯 하다.

기업 입장에서 넘쳐나는 데이터를 어떻게 분석하고 활용할 것인가? 의 관점에서 다양한 분석을 시도하고 있으나 흔히들 알고 있고 이야기 하는 몇몇 분야를 제외하고는 아직은 갈길이 먼것이 현실이지 않을까 생각한다.

책으로 돌아와서, 이쪽분야가 워낙 핫하다보니 기초에서 활용까지 정말 다양한 책이 나온다.

통상적으로 머신러닝/딥러닝을 분류해보자면 가장 기본적으로 지도 학습과 비지도 학습으로 분류해 볼 수 있다.

산업현장에서는 당연히 레이블이 있는 데이터에서 없는 데이터로의 분석 초첨이 맞춰지고 레이블된 데이터의 단순한 분석과 활용에서 벗어나 정형화 되지 않은 데이터에서 새로운 의미와 가치를 발굴하는 형태로 바뀌어가고 있다.

레이블이 없다는 것은 사실 좀 막막하다.

한편으로 핸즈온이란 타이틀을 가지는 책들은 특징은 단순한 지식이나 방법의 전달뿐만 아니라 어떻게 활용할 것인가에 대한 고민이 담겨있다는 점이다. 이론과 기술이 딱 거기에서 그치지 않고 이를 어떻게 현장에서 활용할 것인가 또는 접목할 것인가에 대한 길라잡이 역할을 해줄 수 있다는 점에서 다른 책들과는 차별화된다고 생각한다.

그 와중에 만난 핸즈온 비지도 학습/한빛미디어...

이 책은 특이하게도 비지도 학습 방법론과 이를 어떻게 활용해야 하는지를 다루고 있다.

내 기억에 아직은 비지도 학습만을 따로 떼서 설명하는 책은 없었던 것 같다.

왜냐하면 어렵기도 하고 핸즈온이란 타이틀을 붙일만큼의 활용에 관한 내용을 접목하기에 알려진/일반화된 내용들이 많이 없기 때문이기도 하지않았을까 추측해본다.

이 책은 그런 의미에서 기존과 다른 색다른 시도이기도 하면서 앞으로의 방향성을 잘 집었다 생각한다.

비지도 학습 방법론의 이론적인 개념도 다루고 있지만 이를 이용해서 어떠한 문제를 해결하기 위해 어떻게 활용할지에 대해 좀 더 초점을 두고 있다.

앞으로의 방향성과 트렌드에 비춰보면 비지도 학습의 수요와 중요도 그리고 활용도는 더욱 높아질 꺼라 생각하고 이를 위한 좋은 길잡이 역할을 할 수 있는 책이 아닐까 생각한다.

※ 본 리뷰는 IT 현업개발자로서 한빛미디어 리뷰어로 출판사로부터 제공받아 읽고 작성한 글입니다.

wizm***l2020-08-24

아주 친절한 '핸드온 비지도 학습'

회사에서 인공지능 관련 일을 하기에 (내외부) 현업 고객들이 현장 니즈를 주제로 아이디어를 토의할 때가 있습니다. 얼마 전부터 AI 학습용 데이터를 확보하기가 어렵다는 것은 잘 알게 된 현업이 간혹 비지도 학습으로 해결할 수 있는지 물을 때가 있었습니다. 그냥 이미지 데이터, 그냥 비정형 텍스트 문서 데이터는 많은데, 학습용 데이터로 가공하려면 태깅, 라벨링 작업이 필수적이며 인건비가 상당히 들 수 밖에 없습니다. 때문에 비지도 학습이 데이터가 부족한 현실을 타개하는 돌파구가 되어줄 수 있는지 알고 싶어했습니다. 안타깝지만 비지도 학습이 그런 식으로 도깨비 방망이가 되지는 못한다는 답변을 해야 할 때가 태반이었습니다.

이제까지 제가 일하는 곳은 PCA와 K-Means로 전형적인 비지도 학습만 해보았습니다. 이 정도만 해도 꽤 효과적이었습니다. 그래도 최근 몇 년 사이에 딥러닝과 더불어 비지도 학습 기술도 크게 발전하고 사례가 많이 나오고 있음을 알았기에 어떻게 익혀 볼까 고민만 하던 차에 반가운 책이 나왔습니다.

집어 들기 버겁도록 두꺼운 원서나 왜 번역했는지 모를 번역서는 있었어도, 비지도 학습을 주로 다룬 입문서는 많지 않았기에 정말 반가웠습니다. 인공지능, 머신러닝을 처음 접하는 독자는 다른 좀 더 얇은 입문서를 먼저 읽고 나서 이 책을 봐도 좋겠습니다. 제가 봤을 때에 이 책은 지도학습에는 낯설지 않은 독자를 대상으로 합니다.

목차로 훑어 봐도 살짜기 놀랄 만큼 상당히 폭넓은 주제를 다룹니다. 데이터 분석, 이미지 인지 등 비지도 학습으로 할 수 있는 전반을 모두 경험하도록 꾸몄습니다. 중간 중간 입문자에게 어려울 수 밖에 없는 부분마다 친절한 역자주가 도움말을 줍니다. 이 책이 가진 장점 중 하나입니다. 텐서플로/케라스, Scikit-learn을 두루 쓴 것도 좋아 보입니다. 비즈니스에 따라 사이킷런으로 충분한 때도 많기 때문입니다. GPU 쓰기가 부담될 때가 좀 있기도 합니다.

이 책으로 독학을 한다고 하면 거의 매일 일정 분량을 실습하고 트러블 슈팅을 한다는 전제 하에 못해도 두 달은 걸리지 않을까 합니다. 석 달이 걸렸다고 해도 느리지는 않습니다. 그룹 스터디 용도로 쓰기에도 좋겠습니다. 중간 중간 좌절하는 독자에게는 '원래' 이런 책은 100% 이해가 안 가더라도 일단 끝까지 모두 끝내면 결국 남는다는 말씀을 드리고 싶습니다. 마냥 쉽지 않기에 시간을 들여 도전할 만하다는 현실도 상기하길 바랍니다.

pcr3***l2020-08-23

핸즈온 비지도 학습을 정리할 수 있는 책

핸즈온 비지도 학습

한빛미디어 리뷰단으로 등록되어서 이번달에 온 책은 핸즈온 비지도 학습!!

먼저 책의 첫 두개의 장으로 이루어진 챕터 1은 '비지도 학습의 개요'로

비지도 뿐만 아니라 지도 학습과 준지도 학습의 개념과 개요를 설명해주고 있다.

아무래도 이론적이 부분이 많다보니 어렵게 느껴질 수 있는 부분도 많고

이해하려면 실습하며 왔다갔다를 많이 하게 되는 것 같다.

챕터2 '사이킷런을 사용한 비지도 학습 모델' 에서는

본격적으로 사이킷런을 사용한 예제를 보여주는데 중요한 부분은 [차원 축소]와 [클러스터링]의 개요로 보인다.

그것을 이용해 이상탐지와 그룹 세분화를 보여주는데 보통 우리가 아는 소셜등에서는 마케팅을 위해 그룹세분화를 많이

사용할 것으로 생각이 들어 더 잘 본것같다.

뒤에서부터는 텐서플로와 케라스를 사용하는 신경망 모델과 심층 신경망 모델이다.

그냥 비지도 학습 뿐만아니라 비지도 학습의 재현율 향상을 위해 약간의 레이블을 활용하며

준지도 학습문제로 바꾸는 방법 등을 가지고 있다.

보다보니 비지도 학습가 어떻게 쓰이고 응용되는 지를 중점으로 설명하고 있다고 느꼈습니다.

번역도 잘 되어 있는 것으로 보이고 내용도 충실해 해당 분야에 종사하는 분들의 경우 도움이 될 것으로 보이지만

인공지능에 관심이 없었거나 기초가 없을 경우 이해하기가 어렵거나 그냥 돌려보는 정도일 것 같았습니다.

내용도 알차고 책의 크기에 비해 상당히 방대한 내용을 지니고 있었습니다.

allhp***l2020-08-23

비지도 학습 모델을 경험하시고 싶은 분들에게 추천합니다

https://allhpy35.tistory.com/55

더욱 자세한 리뷰는 위의 링크를 참조해주세요

머신러닝의 기본적인 원리 보다는 비지도 학습에관한 이론과 활용에 집중 한 책입니다

하지만 비지도 학습의 이론과 활용에서 부족하다는 말은 아닙니다 각각의 모델에서의

더욱 정확한 값을 유추하는 방법 각각의 모델의 결과 사진과 많은 코드가 아닌 간결한 코드로 구현 할 수 있어서 좋았습니다

파이썬을 처음 접하시는 분들은 추천드리기 어려울거 같습니다

eehoesk***l2020-08-23

비지도 학습으로 옮겨가려는 지도학습러들에게 추천하고 싶은 책

이 책은 번역본인데, 번역본이라는 느낌이 들지 않게끔 설명이 상세하고, 매끄러워 초보자들도 쉽게 이해 할 수 있도록 하였다. 또한 TensorFlow 및 Keras 프레임워크를 주로 사용하고자 하는 사람들에게 많은 도움이 되는 책이다. 다만, TensorFlow 1.x 버전 기준으로 설명을 하고 있다는 것이 약간 아쉽긴 하다. 그래도 기본 개념을 잘 담고 있어서 감안하고 보면 될 듯 하다.

일단 비지도 학습이란 일반적으로 우리가 알고있는 지도학습과는 달리 레이블(label)을 사용할 수 없는 것이다. 그렇기 때문에 지도 학습 문제보다 문제가 명확하지 않게 정의된다는 특징을 가진다. 하지만 이러한 특징이 지도학습 보다 우수한 성능을 낼 수 있다. 일반적으로 지도 학습에서는 수 많은 데이터들을 라벨링 해야된다는 문제점이 있다. 이러한 문제점을 해결해줄 수 있는게 바로 비지도 학습이다.

"비지도 학습은 데이터에서 새로운 패턴을 찾는다" 바로 이 특징이 비지도학습의 강점이라고 할 수 있다.

지난간 머신러닝 분야에서 인공지능으로 성공한 분야들을 살펴보면 대부분 지도 학습 기반이었지만, 최근에는 비지도 학습을 적용한 사례가 일반화 되고 있다. 대표적인 분야로는 "이상치 탐지" 분야가 있다.

차원을 감소하게 되면 원라의 고차원 특징 공간을 변형된 저차원 공간으로 줄일 수 있다. 이 낮은 차원 공간에서 우리는 대부분 점들이 빽빽하게 놓인 곳을 찾게 된다. 이 부분은 일반 공간(Normal Space) 라고 하며, 더 멀리 있는 점들은 이상치(Outlier)라고 할 수 있다. 이러한 이상치들을 찾는 것이 비지도학습의 목적이며, 이를 이용하여 그룹을 세분화 할 수 있다.

이 책에서는 비지도 학습을 위한 일반적인 개념에서부터 실전에 적용 할 수 있는 학습 기법들 까지 설명하고 있기 때문에 입문서로 추천하고 싶은 책이며, 머신러닝을 아예 모르는 사람 보다는 비지도 학습으로 옮겨가려는 지도학습러들에게 추천하고 싶은 책이다.

seren***l2020-08-23

비지도학습을 모아모아

비지도 학습관련으로 꽉꽉 채운 내용이다.

400 페이지가 살짝 넘어가는 내용중 살짝 넘는 내용을 제외하면 비지도 학습과 관련해서 정리되어 있다.

이론책은 많이 나오고 볼때 마다 아..그렇지. 그렇지만 그래서 ..어떻게 쓴다고? 라는 생각과 함께 많은 좌절을 겪는다.

많은 책을 보며 시행착오를 겪은 나같은 독자들에게 이런 책은 참 친절하다.

예제 코드와 결과를 짝지어 차근히 보여준다.

~~헤매지 말지어다.~~

시각화에 고민하지 말자! 다 설명해 준다!

코드를 보고 칠때도 고생하지 않아도 된다. 컬러라 구분이 잘되어있다. (눈물.)

실전을 위한 예제와 실습을 통한 학습에 대한 최적화가 되어 있어서 비지도 학습을 적용하고 싶은데 이책 저책 뒤적이는 사람들에겐 이 한권으로 끝낼 수 있게 도와준다.

더이상의 설명이 필요없다. 직접 보고 해봐야 한다!

이후에 더 필요한 내용이 있다면 더 심화된 다른 책을 꺼내들 수 있도록 하는 아주 참한 시작점이 될 수 있는 책이다.

미뤄둔 테스트를 얼른 해 보아야겠다.

이런 책을 발간해줘서 너무 기쁜 마음에 펄쩍 펄쩍!

lowgi***l2020-08-23

핸즈온 비지도 학습

인공지능이 이슈가 된 것은 알파고의 역할이 컸습니다.

인공지능이 사람을 이길 수 없을 것이란 판단 때문일 겁니다.

체스라는 벽을 인공지능이 먼저 넘었습니다.

바둑의 경우 경우의 수가 많아 어려울 것으로 여겨왔는데요.

그렇게 예상했던 바둑도 인공지능이 이겼습니다.

인공지능에는 지도학습과 비지도 학습이 있습니다.

이를 잘 알려주는 책이 나와 소개해 드리려 합니다.

책 제목은 ‘핸즈온 비지도 학습’입니다.

이 책을 통해 비지도 학습이 무엇인지 머릿속에 이해가 되면 좋겠습니다.

1. 사기탐지 영역과 이커머스

사기 탐지 영역과 이커머스에서 고객 실시간 데이터를 분석합니다.

신용카드 사기를 탐지하려면 어떻게 해야 할까요?

총 거래수 에서 사기거래를 구분해야 합니다.

사기 건은 레이블을 1로 지정하고 정상 건은 0으로 지정해줍니다.

이상치 스코어를 정한다면 판단할 근거가 있어야 합니다.

일반 거래들과 비교해봤을 때 비정상적인 거래는 눈에 띄는 데이터가 있을 수 있습니다.

그런 데이터는 주목해서 봐야 비정상적인지 파악 가능합니다.

이커머스도 고객의 정보를 분석하는 것으로 눈에 띄는 데이터를 찾을 수 있습니다.

2. 블랙박스 학습

인공지능은 블랙박스와 화이트 박스로 학습합니다.

블랙박스는 어떤 형태로 데이터가 처리되는지 볼 수 없습니다.

화이트 박스는 데이터가 어떻게 처리되는지 알 수 있습니다.

이 책에서 비지도 학습을 주로 다룹니다.

지도학습은 직접 지도하며 학습을 하면서 데이터를 쌓습니다.

하지만 비지도 학습은 인공지능이 스스로 학습하는 겁니다.

딥마인드에서 만든 알파고도 스스로 학습을 시켜서 자가 학습을 시킨 겁니다.

사람이 직접 데이터를 입력하지 않아도 알아서 데이터를 입력하는 형태입니다.

Ps

비지도 학습과 함께 준지도 학습에 대해서도 알려줍니다.

비지도 학습 문제는 준지도 학습으로 전환이 가능합니다.

준지도 학습으로 전환하려면 레이블이 없는 데이터를 만들어야 합니다.

준 지도 학습은 레이블이 안 된 것도 효율적으로 레이블을 붙여줍니다.

이 책을 통해 지도 학습, 비지도 학습, 준지도 학습이 이해되시길 바랍니다.

비지도 학습에 대해 궁금하신 분들에게 이 책을 추천합니다.

k13***l2020-08-23

인공지능 딥러닝 심층 비지도 학습

딥러닝, 인공지능이 대세가 되어가면서, 조금 더 구체적인 활용방법이 논의되고 있는 사항이다.

그래서 지도학습, 비지도학습으로 접근한다고들 이야기들 한다. 바로 데이터 특성에 따라 원하는 결과의 방향에 따라 세부적인 방법론을 따지게 된다. 그런면에서 이 책은 비지도 학습을 보다 심층적으로 풀어놓은 책이다.

물론 다른 일반 딥러닝, 인공지능 책에도 언급되는 지도학습, 비지도학습이지만 전체를 다 설명하기에 한 챕터미만으로 구성되지 일수지만 보다 다양하게 비지도학습 내용을 접할 수 있다는 것이다.

한빛의 핸즈온 시리즈이기도 하다.

Using Python, 파이썬으로 활용한 비지도 학습이다.

주요 내용이 책뒷면에 정리되어 있다.

책의 구성

1. 비지도 학습 개요2. 사이킷런을 사용한 비지도 학습 모델

3. 텐서플로와 케라스를 사용한 비지도 학습 모델

4. 텐서플로와 케라스를 사용한 심층 비지도 학습 모델

예제 다운로드 안내

한빛의 미리보기는 막강하다. 다른 출판사의 내용보다 충실하고 내용도 많다. 그래서 이책이 어떤 책인지 맛보기 이상의 혜택이 있다는 것이다.

https://preview2.hanbit.co.kr/books/afcc/#p=1

책의 시작은 비지도 학습의 개요로 부터 시작되어, 사이킷런, 텐서플로, 케라스를 활용하는 내용이다.

안 레쿤

인간과 동물의 학습 과정은 대부분 비지도 학습 방식이다. 만약 지능이 케이크라면 비지도 학습은 케이크의 본체다. 지도 학습은 케이크 본체 위에 바른 크림이며, 강화 학습은 케이크 위에 얹은 체리다. 우리는 크림과 체를 맏드는 방법은 알고 있지만, 케이크를 만드는 법은 모른다. 진정한 AI를 구현하기 위해서는 비지도 학습 문제를 먼저 해결해야 한다.

비지도 학습에 관심이 있는 분들에게 많은 양의 자료가 공급되는 책이다.

daeh***l2020-08-23

머신러닝과 딥러닝 곳곳에 흩어져있는 비지도학습을 정리할 수 있는 기본서!

[ 한빛미디어에서 주관하는 '나는 리뷰어다' 활동에서 제공받은 책을 통해 작성된 서평입니다 ]

머신러닝과 딥러닝 책을 좀 봤다면, 비지도학습을 다루는 챕터를 분명히 보았을 거라고 생각한다.

보통 국내 책마다 2,3챕터정도는 비지도학습의 기법에 대한 설명과 핸즈온으로 구성된 게 많은 걸로 안다.

이 책은 철저하게 비지도학습에 초점을 맞춘다. 사용하는 라이브러리는 사이킷런, 텐서플로(1.xx), 케라스을 이용한다.

이 책은 머신러닝 입문자들이 보기는 부적합하다. 다른 책이나 강의로 조금 공부를 한 사람이 보기에 적합하다고 본다.

책의 초반이나 챕터마다 초반에 기본적인 개념에 대한 정리를 해주지만 몇 장 되지 않는다. 그러니, 다른 머신러닝 책을 1,2권 정도 공부해본 사람이 보길 권한다. 물론 여기에는 케라스나 텐서플로우도 기본을 조금은 해놓는 거까지가 전제다.

1,2장까지는 머신러닝에 대한 기본적인 개념과 지도학습에 대한 설명과 실습을 진행한다. 왜냐면 비지도학습을 제대로 이해하려면 지도학습을 명확히 알아야 하기 때문이다. 헌데, 한 챕터로 정도로는 지도학습에 맛만 조금 볼 수 있기에 다른 책들을 통해 지도학습에 대한 좀 더 다양한 챕터와 실습을 해본 뒤에 비지도학습으로 넘어가는 것이 좋다고 본다.

3장부터 6장까지는 사이킷런을 이용해서 비지도학습의 굵직한 기법들을 하나씩 설명하고 핸즈온한다.

차원 축소, 이상치 탐지, 클러스터링 등이다. 다루는 데이터셋은 캐글에서 다운받을 수 있는 데이터이며 mnist처럼 오래된 데이터들이다.

역자의 깃허브에 가면 데이터셋을 쉽게 받을 수 있다. 리뷰어의 경우는 git lfs pull 에서 뭔가를 자꾸 purchase 하라는 에러가 나오길래 그냥 데이터셋 링크 가서 다운로드 했다.

챕터 7부터는 딥러닝 프레임워크들을 이용한 비지도학습을 설명한다.

이 책에서 다루는 tensorflow 는 1 버전이다. 최근 나오는 책들은 2 버전들인데 아마 원서가 최소 1년 전에 출간되서 그 간격에서 tf1 으로 한 게 아닐까 싶다. 헌데, 케라스도 사용하니 tensorflow 1 버전을 안 사용했어도 크게 문제 안될 거라고 생각한다. 왜냐면, 이 책에서 비지도학습에 대한 여러가지 api 사용법을 핸들링하기 좋은 데이터셋으로 다루기에 tensorflow 1 어려운 모델을 구현하거나 하지 않는다. 나 역시 tensorflow 1 버전은 예전에 잠깐 공부한 수준인데 거기서 크게 더 깊어지지는 않는다. 그러니 api 사용법은 걱정하지 말자. 그냥 그대로 따라치면 된다.

정리하자면, 책에서는 비지도학습에 관련된 흩어진 인공지능의 부분들을 다 모아놓은 책이다. 마지막 챕터까지 가면 GAN, 시계열 클러스터링 등 조금은 어려울 수 있는 부분까지 핸즈온을 한다. 그리고 그렇게 깊게 들어가지는 않는다. 이후의 깊이는 공부하는 사람이 여러 구글링과 논문, 더 심도있는 책들을 통해서 하면 될 것 같다. 여하튼, 머신러닝과 딥러닝 책들에 흩어져있는 비지도학습들을 잘 모아서 정리해놓은 책이라는 느낌이다. 정리해놓은 책이기에 깊이가 엄청나지 않은 느낌이니 부담없이 읽어도 된다고 본다. (물론 기본서 1,2권정도 보고 공부한 사람이라는 전제하이다)

비지도학습은 업무에서 데이터의 샘플이 부족하거나 라벨이 없거나 하는 경우가 대다수이기에 무조건적으로 고려해야 되는 옵션 중 하나라고 본다. 그러니 비지도학습에 대한 큰 기법들과 API 사용법을 정리한 이 책은 현업에 있는 사람들에게 큰 도움이 된다고 본다.

nado***l2020-08-23

핸즈온 비지도 학습, 비지도 학습을 전체적으로 조망할 수 있는 책

비지도 학습? 아마 인공지능에 대해 잘 모르시는 분들은 바로 와 닿지 않을 것이다. unsupervised 라는 단어를 우리말로 비지도로 해석된 거 같다. 지도가 아니라는 의미인데, 자율이라는 단어를 떠올리면 쉽게 이해할 수 있다. 비지도 학습은 즉 자율 학습이라 할 수 있다. 지도 학습은 미리 정해진 규칙을 기반으로 학습하여 답을 찾아가는 것이고, 비지도 학습은 데이터 속에서 문제점, 숨겨진 패턴을 스스로 찾아가는 머신러닝 기법이라 할 수 있는 것이다.

비지도 학습은 일반 프로그래밍처럼 주어진 동작만 하거나, 무엇을 알아내라는 가이드라인이 미리 주어지지 않다 보고, 데이터 속에서 무언가를 추리해서 찾아내야 하므로, 인간의 창의적 사고에 좀 더 가깝다고 할 수 있다.

그런 만큼 비지도 학습을 공부하는 데, 난해한 것들이 많다. 인공지능 입문서에서는 아예 다루지 않는 경우도 많고, 다루더라도 단편적으로만 나오곤 한다. 그런데 이번에 본 '핸즈온 비지도 학습'은 온전히 비지도 학습만을 주제로 다루고 있는 책으로 비지도 학습에 필요한 기본 이론부터 간단한 활용 실습까지 다루며, 전체적으로 아웃라인을 그릴 수 있게 한다. 한마디로 비지도 학습을 조망하는 책인 것이다.

책 내용을 살펴보면, 0장부터 2장까지는 비지도 학습 개요 파트로 0장에서는 인공지능의 역사에 대해 일단 한번 다시 체크하고, 1장에서는 지도 학습과 비지도 학습에 필요한 기본 용어 이해와 기술, 알고리즘에 대해서 알아본다. 생소할 수 있는 개념과 용어 때문에 번역자의 별도 주석이 참 많이 달려 있는 곳이기도 하다.

본격적인 내용은 2장부터 시작되는데, 학습과 실습에 필요한 깃, 파이썬 아나콘다, 텐서플로, 케라스, 그레이디언트 부스팅, 클러스터링 알고리즘, 주피터 노트북 활성과 같은 컴퓨터 환경 설정부터 익히고, 실습에 필요한 데이터 준비 및 시각화, 머신러닝 모델 훈련을 하게 된다. 다만 현재 버전과 차이가 있는 부분도 있다.

파트 2에서는 사이킷런을 사용하여, 계산 비용이 많이 드는 대규모 문제 해결에 쓰이는 차원축소, 주성분 분석 PCA, 그룹화하는 클러스터링과 같은 비지도 학습 개념을 익힌다. 앞에서 학습한 신용카드 사기를 통해, 테러, 돈세탁 같은 곳에 사용할 수 있는 이상 탐지에 대한 것들도 배운다.

나머지 파트인, 파트 3, 4는 텐서플로와 케라스를 통해 3부는 얕은 신경망, 4부는 심층 신경망으로 나눠 비지도 학습을 공부한다. 지도 학습과 비지도 학습의 장점들을 배합한 준지도 학습에 관한 것도 이곳에서 알아본다. 책 앞쪽에서는 주로 신용카드 사기 관련 데이터를 사용했다면, 후반부인 파트 4는 무비렌즈 데이터셋, 이미지, UCR 시계열 데이터, 자료를 사용해서 볼츠만 머신, 신경망, 클러스터링과 같은 다양한 것들에 대해 배운다. 이 파트는 실제 응용에 관련된 내용들에 대해 좀 더 본격적으로 다루며, 비지도 학습의 앞으로의 전망도 동시에 알아보고 있다.

이처럼 '핸즈온 비지도 학습' 한 권의 책에 비지도 학습의 무척 많은 것들을 다루고 정리하고 있어 좋았지만, 그 양이 많다 보니, 개인적으로는 다 이해하는 데 버겁다는 느낌을 받았다. 총 444쪽의 책이지만, 그 몇 배가 되는 백과사전을 접한 기분까지 들었다. 내가 여태 알았던 것은 진짜 새 발의 피였음을 절실히 느끼게 한다. 실습해 볼 것도 많고, 책 속에 나온 내용 중에는 축약된 것들이 더러 있어서, 별도로 찾아 볼 것도 많았다.

즉 '핸즈온 비지도 학습'은 초보를 위한 입문서가 아니라는 것이다. 어느 정도 이해하기 위해서는 적어도 인공지능에 대해 기본 지식이 있어야 하고, 텐서플로와 케라스를 다룰 줄 알아야 한다. 이것들이 되어 있는 분들에게는 다양한 방법론을 접할 수 있는 아주 유용한 비지도 학습 책이 되겠지만, 그렇지 않다면, 아무것도 이해하지 못할 수가 있다.

그동안 인공지능, 기계학습에 관련된 책을 여럿 봐왔는데, 이번 '핸즈온 비지도 학습'을 보고 나니, 너무 단편적인 지식만을 접해왔다는 것을 절실히 느끼게 되었다. 확실히 쉬운 책만 보는 것은 깊이에 한계가 있었다. 특히 비지도 학습에 관한 내 지식은 거의 전무한 수준이었다. 그나마 '핸즈온 비지도 학습' 덕분에 머신러닝 안목을 넓힐 수 있었고, 어떤 것들을 알아야 할지 공부의 방향을 잡을 수 있었다. 인공지능을 좀 더 깊게 알고 싶은 분들에게 유익한 책이 되어 줄 것이다.

iamdaye***l2020-08-21

[리뷰] 핸즈온 비지도 학습

[한줄평]

다양한 실습 예제로 비지도 학습을 배울수 있음

[목차구성]

CHAPTER 0 서문

PART 1 비지도 학습 개요

CHAPTER 1 머신러닝 생태계와 비지도 학습

CHAPTER 2 머신러닝 프로젝트 A to Z

PART 2 사이킷런을 사용한 비지도 학습 모델

CHAPTER 3 차원 축소

CHAPTER 4 이상치 탐지

CHAPTER 5 클러스터링

CHAPTER 6 그룹 세분화

PART 3 텐서플로와 케라스를 사용한 비지도 학습 모델

CHAPTER 7 오토인코더

CHAPTER 8 핸즈온 오토인코더

CHAPTER 9 준지도 학습

PART 4 텐서플로와 케라스를 사용한 심층 비지도 학습

CHAPTER 10 RBM을 사용한 추천 시스템

CHAPTER 11 DBN을 사용한 피처 추출

CHAPTER 12 GAN

CHAPTER 13 시계열 클러스터링

CHAPTER 14 결론

[이 책의 특징]

ㆍ다양한 머신러닝 접근 방법의 장단점(지도 학습, 비지도 학습, 강화 학습)

ㆍ머신러닝 프로젝트의 전반적인 설정 및 관리

ㆍ차원 감소 알고리즘, 군집화 알고리즘 활용

ㆍ오토인코더로 자동 피처 엔지니어링 및 피처 선택

ㆍ지도 및 비지도 학습 알고리즘 결합으로 준지도 학습 솔루션 개발

ㆍ볼츠만 머신을 사용하여 영화 추천 시스템 구축

ㆍ생성적 적대 신경망(GAN)과 심층 신뢰 신경망(DBN)을 사용한 합성 이미지 생성

ㆍ시계열 데이터에 대한 군집화 수행

ㆍ최신 비지도 학습 성공 사례 및 향후 전망

[대상 독자]

ㆍ데이터 분석 관련 업무 담당자(주니어~시니어)

ㆍ실무에 머신러닝을 적용하려는 개발자

ㆍ인공지능 서비스 구현과 관련이 있거나 관심 있는 누구나

[서평]

오랜 만에 비지도 학습 책중 괜찮은 것이 나왔습니다. 이책은 인공지능 기본 이론부터 비지도 학습의 활용 예제 까지 잘 정리되어 있다. 머신 러닝을 학습 목적이라면 지도학습, 비지도 학습, 강화학습 이론 책이 좋으나 실무에서는 지도학습에서 정답을 주고 찾는 것보다는 정답이 없고 데이터들로 부터 도출 해내야 하는 문제들이 더 많다. 그리고 대부분 지도 학습 기반의 예측 문제를 다루고 배치기반으로 모델이 운영되고 있습니다. 모델 훈련 과정에서 데이터 품질이 좋지 않거나 레이블 데이터가 부족하더라도 전처리, 샘플링 기법, 튜닝등으로 어느 정도 해결은 가능 합니다. 하지만 요즘은 분석 결과의 실시간 처리와 적용이 기분이 되었습니다. 데이터 수집 속도 또한 과거와 달리 빨라졌습니다. 최근 많은 기업들이 데이터 분석을 통해서 경쟁 우위를 확보하고 예측 문제도 차츰 그 대상의 범위를 좁혀가고 있는 추세 입니다. 레이블 데이터 불균형은 심화되고, 동시에 이종 데이터 간 결합의 필요성은 더욱 증가했습니다.

비지도 학습은 데이터 분석가 입장에서 이러한 문제에 대응할 수 있는 매우 유용한 기술 입니다. 이책에서 소개한 사기 거래 탐지기술을 다양한 분야에 응용할수 있습니다. 사기 탐지 영역뿐만 아니라 이커머스와 같은 고객을 다차원으로 이해하고 분석 결과를 실시간으로 빠르게 적용해야 하는 도메인에서도 유용하게 활용할수 있는 주제도 다루고 있습니다. 컴퓨팅 리소스 제약이나 성능 한계를 극복하기 위한 차원 축소 기법과 지도 및 비지도 학습을 혼합해 소량의 레이블 데이터만으로도 예측에 적용할 수있는 준지도 학습, 원본 데이터의 확률 분포를 학습해 새로운 데이터에 대한 추론에 활용할 수 있는 생성적 비지도 학습등 이종 데이터간의 결합 요구나 레이블 데이터의 불균형과 같은 현실 세계에서의 한계점을 극복하는데 유용한 방법에대해서 배울수 있습니다.

현재 비지도 학습은 아직 희소한 주제지만 조만간에 비지도 학습 및 이를 활용한 응용 분야가 확대될 것입니다. 미리미리 공부해서 대비하면 좋겠습니다.

one2***l2020-08-20

핸즈온 비지도 학습

이 책은 케라스와 사이킷런으로 비지도 학습에 대해 설명하고 있습니다.

핸즈온 시리즈의 경우, 항상 머신러닝을 공부할때 도움을 받고 있어서 이 책은 원서가 출간 됐을 때 부터 읽고 싶은 책이었습니다.

이 책은 비지도 학습을 포함하고 있는 다른 책들과는 달리 챕터가 아닌 전체가 비지도 학습에 대한 내용을 다루고 있다는 면에서 매력있는 책입니다.

게다가 핸즈온 시리즈 답게 실세로 응용할 수 있는 다양한 예제와 알고리즘을 설명하고 있습니다.

저는 특히, 이상감지 챕터와 시계열 군집화 챕터를 재미있게 읽었습니다.

이 책이 다루는 내용은 차원 감소 알고리즘, 군집화 알고리즘, 온터인코더, 볼츠만 머신을 사용한 추천시스템, GAN, 시계열 데이터에 대한 군집화 그리고 마지막으로 비지도학습 성공 사례 및 향후 전망에 대해 다루고 있습니다.

그 동안 지도학습에 비해 강화학습 그리고 비지도 학습은 갈길은 먼 것 같습니다.

그 만큼 활용 분야가 무궁무진하기 때문에 기대 되는 분야이기도 합니다.

이 책은 그런 측면에서 좋은 길잡이가 되지 않을까 싶습니다.

kcsgood***l2020-08-20

비지도 학습

흔히 머신러닝의 학습 방법을 크게 3가지로 지도 학습(Supervised Learning), 비지도 학습(Unsupervised Learning), 강화 학습(Reinforcement Learning)으로 나눠서 설명한다. 나도 전문가는 아니지만 내가 이해한 대로 간단히 설명하면, 지도 학습은 말그대로 학습시키고자 하는 모델에게 데이터와 답을 같이 알려줌으로써 데이터와 답간의 상관관계를 학습시키고, 이를 기반으로 접하지 못한 데이터에 대한 예측이나 분류 작업을 할 수 있게끔 하는 학습 방법이고, 강화학습은 아무 것도 정의되어 있지 않은 모델을 알지 못하는 환경에서 자유롭게 탐험도 하면서, 내면적으로 그 환경에 포함되어 있는 다이나믹스를 이해하는 학습 방법으로 알고 있다. 그래서 강화학습을 통하면, 사용자가 만든 모델은 그 환경에서 가장 최적화된 정책을 학습할 수 있게 된다.

그러면 설명하지 않은 비지도 학습이 남게 되는데, 비지도 학습은 지도학습과는 다르게 주어진 데이터에 대한 답이 없다. 그래서 뭔가 예측하고, 분류를 하는게 목적이 아니라 데이터가 가진 특성을 이해하여 비슷한 데이터끼리 묶어준다던가, 혹은 일상적인 데이터 중에서 비정형적인 데이터(혹은 outlier)를 구분시켜주는데 많이 활용한다. 그래서 뭔가 모델에게 지도하는 형태가 아닌, 모델 스스로가 특징을 이해할 수 있게끔 도와주는 알고리즘들이 이 비지도학습에 속한다. 이번에 소개하는 책는 이 "비지도 학습"에 관한 다양한 알고리즘과 scikit-learn 및 여러 알고리즘에 포함된 비지도 학습 알고리즘의 사용법에 대한 설명을 담았다.

사실 시중에 나온 대부분의 머신러닝/딥러닝 관련 책들은 대부분 이 주제에 대해서 담고 있다. 대부분의 책들이 흔히 많이 알려진 데이터(MNIST나 CIFAR-10, Iris 등)을 가지고, 이를 비지도/지도 학습 등을 통해서 학습시키고, 이에 담긴 의미를 전달하면서 내용을 개진한다. 그런데 사실 이런 인공지능 공부를 해본 사람이나 안해본 사람이나 알다시피 인공지능 기술이 엄청나게 광범위하다는 것을 알고 있고, 얇은 책으로는 이런 내용을 전부 담을 수 없다는 것을 알고 있을 것이다. (그래서 보통은 논문으로 이해하고, github에 있는 코드로 직접 구현하는 공부 방식을 많이 추천하는 것 같다) 그래서 아무리 두꺼운 책이라도, 시중에 나와있는 책만 가지고는 지도학습 잠깐, 비지도학습 잠깐 깊이 있게 다룰 수 없다는게 개인적인 생각이다. 특히 비지도 학습 관련 책은 시중에 나온게 거의 없다... 개인적으로는 이런 생각이 많이 들어서 뭔가 하나의 학습에 특화된 책이 나오면 좋겠다 싶었는데, 이 책은 그런 입장에서는 비지도 학습을 활용할 수 있는 방법을 눈으로 볼 수 있는 입장에서는 마음에 들었다.

좀더 자세하게 살펴보면, 이 책에서는 다음 주제에 대해서 다루고 있다.

Clustering과 이를 평가하기 위한 평가지표 사용법
Dimesionality Reduction 알고리즘
AutoEncoder의 종류들
Abnormality Detection
비지도 학습을 통한 feature engineering
지도 학습과 비지도 학습을 조합한 준지도 학습(Semi-supervised Learning)
GAN (Generative Adversarial Network)
RBM(Restricted Boltzmann Machine)과 DBN(Deep Belief Network)

이 책에서 뽑을 수 있는 부분은 자세한 동작원리보다는 마치 비지도학습을 받는 모델처럼 사람도 예제 코드나 데이터셋을 살펴보면서 어떤 부분에서 활용하고, 응용할 수 있는지를 스스로 이해하는 것에 초점을 맞춘 것 같다. 그래서 책에 각 알고리즘의 동작 원리가 자세하게 설명되어 있다기 보다는 실행한 결과로부터 어떤 insight을 얻을 수 있는지 설명이 잘 되어 있고, 이에 따라 구현하는 부분이 순차적으로 이어져 있다. 그래서 각 장의 처음부터 따라가다 보면서 구현하다 보면 설명하고자 한 알고리즘에 대해 이해할 수 있어서 좋았던 것 같다.

다만 아쉬운 점이라면, 원서가 나온 시점에서 tensorflow 1.x대로 구현되어 있어서 그런지 책의 내용은 tensorflow와 keras로 구현되어 있다는 부분이다. (물론 tensorflow 2.x에서 keras가 내장되어 쉽게 변환이 가능하다. 그리고 원저자 github에서도 tf 2.x로 변환한 jupyter notebook을 공유하고 있다.)

아마 비지도 학습에 관심을 갖고, 현업에 적용해보고자 하는 사람이라면, 시중에 나와있는 여타 책보다도 이 책이 구미가 땡기지 않을까 싶다.

책관련 참고 링크:

wltk***l2020-08-19

핸즈온 비지도 학습 서평

사진 설명을 입력하세요.

[책소개]

1. 케라스를 사용한 텐서플로와 사이킷런으로 비지도 학습 적용 방법을 알려줌

2. 다양한 실습 예제와 코드를 통해 데이터에 내재된 패턴을 찾고 통찰력을 얻거나 이상 징후를 감지

3. 자동화된 피처 엔지니어링 및 피처 선택을 수행 및 새로운 합성 데이터셋을 생성

CHAPTER 0 서문

-----------------PART 1 비지도 학습 개요

CHAPTER 1 머신러닝 생태계와 비지도 학습

CHAPTER 2 머신러닝 프로젝트 A to Z

-----------------PART 2 사이킷런을 사용한 비지도 학습 모델

CHAPTER 3 차원 축소

CHAPTER 4 이상치 탐지

CHAPTER 5 클러스터링

CHAPTER 6 그룹 세분화

-----------------PART 3 텐서플로와 케라스를 사용한 비지도 학습 모델

CHAPTER 7 오토인코더

CHAPTER 8 핸즈온 오토인코더

CHAPTER 9 준지도 학습

-----------------PART 4 텐서플로와 케라스를 사용한 심층 비지도 학습

CHAPTER 10 RBM을 사용한 추천 시스템

CHAPTER 11 DBN을 사용한 피처 추출

CHAPTER 12 GAN

CHAPTER 13 시계열 클러스터링

CHAPTER 14 결론

14.1 지도 학습

14.2 비지도 학습

14.3 강화 학습

14.4 오늘날 가장 유망한 비지도 학습 분야

14.5 비지도 학습의 미래

14.6 마치며

추천 대상

1. 데이터 분석 관련 업무 담당자

2. 실무에 머신러닝을 적용하려는 개발자

3. 인공지능 서비스 구현과 관련이 있거나 관심 있는 일반인

사진 설명을 입력하세요.

단점

1. 텐서플로 1.x 버전

그래도 원서도 번역본 모두 좋은 퀄리티를 보이고, 내용면에서 배울점들이 많기 때

문에 비지도 학습에 관심 있는 분들께 추천드립니다.

리뷰어클럽 서평단 자격으로 작성한 리뷰입니다.