메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

IT CookBook, R로 배우는 데이터 과학

분석에서 예측을 위한 모델링까지

한빛아카데미

집필서

판매중

  • 저자 : 양윤석 , 오일석 , 강래형
  • 출간 : 2019-05-08
  • 페이지 : 440 쪽
  • ISBN : 9791156644460
  • 물류코드 :4446
  • 본 도서는 대학 강의용 교재로 개발되었으므로 연습문제 해답은 제공하지 않습니다.
  • 초급 초중급 중급 중고급 고급
0점 (0명)
좋아요 : 6

다양한 생활 데이터로 쉽게 배우는 데이터 과학

 

데이터에서 가치를 발견하고 이를 문제 해결에 활용하는 데 관심이 많은 사람들을 위한 데이터 과학 입문서입니다. 프로그래밍 경험이 전혀 없어도 시작할 수 있도록 R의 기본 사용법부터 데이터 과학의 주요 주제인 데이터 정제와 가공, 시각화, 모델링과 예측까지 충실히 설명합니다. 데이터 과학 학습을 위한 전형적인 데이터뿐만 아니라 현실감 있는 다양한 생활 데이터도 다양하게 실습해볼 수 있어 스스로 더 재미있는 데이터를 찾아 활용할 수 있는 기초 체력도 다질 수 있습니다. 

 

 

부/장별 요약 

 

  1. 데이터 과학의 시작(1~2장) : 데이터 과학의 개념을 정립하고, 베이스 R과 R 스튜디오로 간단한 데이터를 실제로 다뤄봄으로써 데이터 과학의 세계로 들어갑니다.
  2. R의 데이터형과 연산(3장) : 변수, 데이터형, 연산자, 벡터, 데이터 프레임, 리스트를 배우며 R의 기본기를 다집니다.
  3. 데이터의 취득•정제•가공(4~5장) : 데이터 취득을 위한 파일 읽기와 쓰기, 데이터 정제를 위한 제어문과 결측값•이상값 처리, 데이터 가공을 위한 dplyr 라이브러리 사용법 등을 익힙니다.
  4. 데이터 시각화(6장) : 베이스 R과 ggplot2 라이브러리의 시각화 함수를 이용해 데이터를 이리저리 살피며 전체 데이터를 한눈에 직관적으로 알아볼 수 있게 만드는 방법을 익힙니다.
  5. 모델링과 예측(7~10장) : 7~ 9장에서는 데이터를 가장 잘 설명할 수 있는 모델을 만들고 이 모델로 예측하는 방법을 학습합니다. 10장에서는 모델의 성능을 평가하는 방법과 가장 좋은 모델을 선택하기 위한 기준을 알아봅니다.
  6. 텍스트 마이닝(11장) : 텍스트 데이터를 처리하는 방법을 익히기 위해 문서 단어 행렬을 구축하고 한국어와 영어에 대한 단어 구름을 그려봅니다.
  7. 프로젝트(12장) : 지금까지 학습한 전 과정을 구글 플레이 스토어 앱 데이터에 단계별로 적용해봅니다.

 

R로 배우는 데이터 과학_960.jpg

 

양윤석 저자

양윤석

전북대학교 바이오메디컬공학부 교수로 재직 중이다. 서울대학교 제어계측공학과를 졸업하고, 2002년에 서울대학교 의용생체공학과에서 박사학위를 받았다. 2002~2005년에 ETRI에서 선임연구원으로 재직했다. 주요 연구 분야는 에너지 수확과 휴먼-컴퓨터 인터페이스, 그리고 바이오 공학을 이용한 적정기술이다. 전북대학교 교수들로 구성된 록밴드 Profs에서 베이스 기타를 맡고 있다.

오일석 저자

오일석

전북대학교 컴퓨터공학부 교수로 재직 중입니다. 서울대학교 컴퓨터공학부를 졸업하고, KAIST 전산학과에서 박사학위를 받았으며 주요 연구 분야는 기계학습, 컴퓨터 비전, 인공지능입니다. 저서로는 한빛아카데미의 『파이썬으로 만드는 인공지능』(세종도서 2021년 우수학술도서), 『R로 배우는 데이터 과학』, 『기계학습』(대한민국학술원 2018년 우수학술도서), 『컴퓨터 비전』(대한민국학술원 2015년 우수학술도서)과 교보문고의 『패턴인식』(문화체육관광부 2009년 우수학술도서), 『C 프로그래밍과 스타일링』(2009년), 인피니티북스의 『세상을 여는 컴퓨터 이야기』(2020년)가 있고 역서로는 한빛아카데미의 『앱인벤터2』(2015년)가 있습니다. 

강래형 저자

강래형

전북대학교 유연인쇄전자공학과 교수 및 로스알라모스연구소-전북대학교 한국공학연구소 연구소장으로 재직 중이다. 경북대학교 기계공학부와 전자전기공학부를 졸업하고, KAIST 항공우주공학과에서 박사학위를 받았다. C 언어 기초, 컴퓨터 프로그래밍의 기초, 데이터 과학 기초 등의 강의로 2018년 전북대 참스승 수업분야 최우수상을 수상했다. 주요 연구 분야는 구조 동역학 및 비파괴 검사다.

Chapter 01 데이터 과학 알아보기

01 데이터 홍수 시대

02 데이터 과학 열풍

03 데이터 과학이란?

04 데이터 과학의 절차

4.1 세상과 상호작용하는 데이터 과학

4.2 이 책에서 다루는 범위와 내용

05 데이터 과학 관련 분야

06 데이터 과학 자원

6.1 데이터 저장소

6.2 온라인 교육 사이트

6.3 소프트웨어 도구

6.4 R 공식 문서

역사 속의 데이터 과학

단원문제

 

Chapter 02 데이터 과학으로 풍덩

01 도구 챙기기

02 데이터와 친해지기

03 데이터 시각화 맛보기

04 데이터 과학 학습을 위한 좋은 습관 알아보기

4.1 도움말 청하기

4.2 익숙해지기

4.3 점증적으로 생각하기

4.4 좋은 도구 쓰기

05 좋은 도구 익히기

5.1 통합 개발 환경

5.2 스크립트 창에서의 코딩

5.3 작업 디렉토리의 지정

5.4 라이브러리의 활용

06 데이터와 더 친해지기

6.1 사랑스런 iris 데이터

6.2 돈을 벌어주는 tips 데이터

나는 아마추어 데이터 과학자?

단원문제

 

Chapter 03 R의 데이터형과 연산

01 데이터의 저장과 처리

02 변수

03 데이터형

04 연산자

05 벡터

5.1 벡터 생성

5.2 벡터 연산

5.3 벡터 연산에 유용한 함수

06 배열(행렬)

6.1 배열 생성

6.2 배열 연산

6.3 배열에 유용한 함수

07 데이터 프레임

7.1 데이터 프레임 생성

7.2 데이터 프레임 요소에 접근

7.3 데이터 프레임에 유용한 함수

08 리스트

8.1 리스트 생성

8.2 리스트 요소에 접근

8.3 리스트에 유용한 함수

유용한 R 스튜디오 사용법

단원문제

 

Chapter 04 데이터 취득과 정제

01 파일 읽고 쓰기

1.1 파일 읽기

1.2 파일 쓰기

02 데이터 정제를 위한 조건문과 반복문

2.1 조건문

2.2 반복문

03 사용자 정의 함수 : 원하는 기능 묶기

04 데이터 정제 예제 1 : 결측값 처리

05 데이터 정제 예제 2 : 이상값 처리

미국 명문 대학교의 데이터 과학에 대한 인식

단원문제

 

Chapter 05 데이터 가공

01 데이터 가공이란?

02 베이스 R을 이용한 데이터 가공

03 dplyr 라이브러리를 이용한 데이터 가공

04 데이터 가공의 실제

4.1 방대한 데이터 요약

4.2 모델링을 위한 가공

4.3 데이터 구조 변경

데이터 가공의 의의

단원문제

 

Chapter 06 데이터 시각화

01 데이터 시각화란?

1.1 데이터 시각화의 필요성

1.2 시각화의 기본 요소

02 시각화의 기본 기능

2.1 많은 양의 데이터를 효과적으로 관찰

2.2 데이터를 여러 관점에서 보게 함

03 시각화 도구

3.1 베이스 R

3.2 시각화에 특화된 ggplot2 라이브러리

04 시각화를 이용한 데이터 탐색

시각화는 왜 할까?

단원문제

 

Chapter 07 모델링과 예측 : 선형 회귀

01 모델링과 예측이란?

1.1 간단한 예로 알아보기

1.2 데이터 과학 세계의 모델링과 예측

02 현실 세계의 모델링

03 단순 선형 회귀

04 단순 선형 회귀의 적용 : cars 데이터

05 모델의 통계량 해석

06 다중 선형 회귀

07 다중 선형 회귀의 적용 : trees 데이터

t-검정과 분산 분석

단원문제

 

Chapter 08 일반화 선형 모델

01 일반화 선형 모델은 왜 필요한가?

02 일반화 선형 모델

2.1 단순 데이터에 적용

2.2 실제 데이터에 적용 : Haberman survival 데이터

2.3 특징 선택

03 로지스틱 회귀

04 로지스틱 회귀의 적용 : UCLA admission 데이터

05 로지스틱 회귀의 적용 : colon 데이터

과잉적합

단원문제

 

Chapter 09 분류를 위한 모델

01 회귀와 분류

02 결정 트리의 원리

03 결정 트리 함수의 사용

04 결정 트리의 해석

05 랜덤 포리스트

06 SVM과 k - NN

07 분류 모델의 다양한 적용

7.1 UCLA admission 데이터

7.2 colon 데이터

7.3 voice 데이터

7.4 성능 측정에 대한 고찰

기계 학습

단원문제

 

Chapter 10 모델의 성능 평가

01 예측 오류는 왜 발생하나?

02 정확률

03 일반화 능력 측정

04 교차 검증

05 모델 선택

06 정밀도와 재현율

07 ROC 곡선과 AUC

단원문제

 

Chapter 11 텍스트 마이닝

01 텍스트 마이닝 기초

02 DTM 구축

03 단어 구름

04 문서 분류

05 영어 텍스트 마이닝을 이용한 한국어 처리

06 KoNLP를 이용한 한국어 텍스트 마이닝

트위터 API를 이용한 말뭉치 얻기

단원문제

 

Chapter 12 구글 플레이 스토어 앱 데이터를 이용한 실전 프로젝트

01 프로젝트 소개

02 데이터 정제

03 탐색적 데이터 분석

04 모델링과 예측

FAMILY 앱이 대세?

단원문제

  • 첫번째 리뷰어가 되어주세요.
  • 부록/예제소스
    자료명 등록일 다운로드
    DOWNLOAD 예제소스(From CDN) 2021-10-06 다운로드
    Google Drive 예제소스(from GDrive) 2021-10-06 다운로드
    결제하기
    • 문화비 소득공제 가능

    도서구입 안내

    <한빛아카데미> 도서는 한빛 홈페이지에서 더 이상 판매를 하지 않습니다. 도서 구입은 인터넷 서점을 이용하시기 바랍니다. 양해바랍니다.

    리뷰쓰기

    닫기
    * 도서명 :
    IT CookBook, R로 배우는 데이터 과학
    * 제목 :
    * 별점평가
    * 내용 :

    * 리뷰 작성시 유의사항

    글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

    1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
    2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

    오탈자 등록

    닫기
    * 도서명 :
    IT CookBook, R로 배우는 데이터 과학
    * 구분 :
    * 상품 버전
    종이책 PDF ePub
    * 페이지 :
    * 위치정보 :
    * 내용 :

    도서 인증

    닫기
    도서명*
    IT CookBook, R로 배우는 데이터 과학
    구입처*
    구입일*
    부가기호*
    부가기호 안내

    * 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

    * 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

    * 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

    닫기

    해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
    장바구니로 이동하시겠습니까?

    자료실