메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

한빛랩스 - 지식에 가능성을 머지하다 / 강의 콘텐츠 무료로 수강하시고 피드백을 남겨주세요. ▶︎

이렇게 쉬운 통계학

누구나 쉽게 업무에 활용하는 기초 통계

한빛미디어

번역서

판매중

  • 저자 : 혼마루 료
  • 번역 : 안동현
  • 출간 : 2019-03-10
  • 페이지 : 276 쪽
  • ISBN : 9791162241509
  • 물류코드 :10150
  • 초급 초중급 중급 중고급 고급
4.5점 (8명)
좋아요 : 19

성공적인 비즈니스를 위한 교양 통계! 

거시적 관점에서 이해하고 활용 포인트 파악하기 

 

이 책은 통계학을 구성하는 다양한 요소를 저자 나름의 방식으로 이해하기 쉽게 이미지화하여 전달합니다. 고등학교 수준의 통계학 기초를 용어와 유래부터 차근히 설명하며, 대화 형식으로 통계학의 실제 적용 사례를 하나씩 살펴봅니다. 통계 수식이 등장하지만 수식 자체에 집중하기보다는 통계의 큰 틀을 이해하기 위해 그래프와 각종 그림 중심으로 설명합니다.

 

이러한 과정에서 독자는 통계학을 거시적인 관점에서 직관적으로 이해할 수 있습니다. 통계학이라는 미지의 세계에 갇힌 채 자신이 지금 어디 있는지, 무엇을 알아야 하고 어디까지 이해해야 하는지 손에 잡히지 않아 곤란을 겪는 독자라면 이 책이 분명 도움이 될 것입니다.

 

이 책의 주요 내용

  • 1장 급할수록 서둘러라, 통계학 훑기 
  • 2장 데이터와 그래프 처리에서 큰 실수 피하기 
  • 3장 평균과 분산 이해하기 
  • 4장 정규분포 체감하기 
  • 5장 표본을 이용하여 모집단의 특징 추정하기 
  • 6장 가설을 세우고 올바른 가설인지 확률로 판단하기

undefined

 

혼마루 료 저자

혼마루 료

요코하마 시립대학교 졸업 후 출판사에 근무하며 과학 분야를 중심으로 여러 권의 베스트셀러를 기획하고 편집했다. 통계학 관련 분야가 전문으로, 입문서는 물론 다변량분석, 통계분석 등의 일반적인 주제를 비롯해 엑셀을 이용한 통계, 회귀분석, 베이즈 통계학, 통계학 용어사전 등을 아우르는 30여 권 이상의 책 출간 작업에 참여했다. 데이터 전문 월간지의 편집장을 역임했다. 독립 후 편집 공방 ‘시라쿠사’를 설립했다. 과학 도서를 주력으로 하는 프리랜서 편집자로서의 편집력과 더불어 ‘이과계 주제를 문과계 언어로 초월 번역하는’ 과학 전문 라이터로서의 글쓰기 기술로 정평이 나 있다. 일본수학협회 회원이다. 저서로는 『意味がわかる微分 ⋅積分(의미를 이 해하면서 배우는 미적분)』, 『マンガでわかる幾何(만화로 배우는 기하학)』 등이 있다.

안동현 역자

안동현

연세대학교 심리학과를 졸업하고 웹 개발 프리랜서를 거쳐 IT 전문 출판사에서 기획과 편집 업무를 담당했다. 번역서로는 『이렇게 쉬운 통계학』(한빛미디어, 2019), 『프로그래머, 수학으로 생각하라』, 『처음 만나는 머신러닝과 딥러닝』, 『HTML5 & API 입문』, 『데이터 해석 입문』, 『건강한 프로그래머』(이상 프리렉) 등이 있다.

 

프롤로그_ 쓰레기 데이터로는 쓰레기 분석밖에 나오지 않는다!

01 겨우 900가구의 데이터만 있으면 OK?

02 그 데이터, 믿을 수 있을까?

03 통계학, 어디에 쓰는 물건인고?

04 유용함을 알기 위한 3가지 통계 퀴즈

 

1장_ 급할수록 서두르자, 통계학 훑기

01 ‘통계학 지도’를 머릿속에 넣어두기

02 원시 데이터를 1개의 대푯값으로: 기술 통계학 ①

03 데이터의 흩어짐 정도: 기술 통계학 ②

04 표본으로 생각하기: 추측 통계학 ①

05 셜록 홈즈처럼 추리하기: 추측 통계학 ②

06 가설 세워 검증하기: 추측 통계학 ③

07 통계분석, 다변량분석이란?

08 기존 통계학 vs. 베이즈 통계학   

 

2장_ 데이터와 그래프 처리에서 큰 실수 피하기

01 연속량 데이터와 비연속량 데이터?

02 척도로 데이터 분류

03 명목척도는 ‘서울=1’처럼 임의로 값을 매긴 데이터   

04 서열척도는 ‘순위’ 데이터   

05 등간척도와 비율척도?

■ 통계학 세미나 - 퍼센트와 포인트의 구분   

06 원그래프를 사용할 때 주의점   

■ 통계학 세미나 - 나이팅게일의 ‘닭 볏’  

 

3장_ 평균과 분산 이해하기

01 평균은 대푯값의 대표? 

02 특잇값에 강한 ‘중앙값’ 

03 가장 많은 데이터가 ‘최빈값’ 

■ 통계학 세미나 - 암호 해독에 이용해온 ‘최빈값’ 

04 평균, 중앙값, 최빈값의 위치 관계는?

05 산포도를 나타내는 ‘사분위수•상자수염그림’ 

06 평균에서 ‘분산’으로 

07 ‘분산’으로 산포도 계산하기 

08 ‘분산’에서 ‘표준편차’로 

09 표준편차 계산하기

■ 통계학 세미나 - 일기예보의 ‘평년 기온’이란 평균? 중앙값?

 

4장_ 정규분포 체감하기

01 데이터로 도수분포표 만들기 

02 히스토그램에서 쌍봉형을 발견했다면? 

03 히스토그램에서 분포곡선으로 

04 정규분포 움직이기 ①: 평균 변경 

05 정규분포 움직이기 ②: 표준편차 변경 

06 정규분포로 확률 보기

07 ‘관리도’를 이용한 품질관리 

■ 통계학 세미나 - 엑셀로 정규분포 만들기

08 2개의 서로 다른 정규분포를 1개로? 

09 여러 곳에서 사용할 수 있는 표준정규분포

10 서로 다른 두 집단 비교

■ 통계학 세미나 - 앙리 푸앵카레와 동네 빵집의 인정사정없는 다툼 

 

5장_ 표본을 이용하여 모집단의 특징 추정하기

01 무엇을 ‘추정’할까? 

02 통계학 용어 정리

03 ‘점추정’은 맞을 수도 있다?

04 ‘평균값의 평균’ 분포와 중심극한정리 

05 구간으로 나타내는 ‘구간추정’ 

06 표본 수가 많아지면 어떻게 달라질까? 

07 99% 신뢰도일 때의 구간추정 

08 t 분포, χ2 분포

09 시청률 등은 어떻게 추정할까? 

10 설문조사 응답 수는 얼마가 적당할까? 

■ 통계학 세미나 - 스튜던트 t 분포

 

6장_ 가설을 세우고 올바른 가설인지 확률로 판단하기

01 가설검정은 홍차부인으로부터 시작되었다? 

02 가설검정이란?

03 단측검정? 양측검정? 

04 가설검정 순서

05 검정에서 조심해야 할 두 가지 실수

 

에필로그_ ‘사람의 직감’은 의외로 믿을 수 없다?

01 상품은 어디에 있을까? 확률은 1/2?

02 난치병의 양성 반응을 어떻게 판단해야 할까?

■ 통계학 세미나 - 요코즈나가 '평균 이하' 체중?

재미있는 그림과 도식, 그래프로 쉽게 익히는 기초 교양 통계이야기

 

통계학은 우리가 일반적으로 짐작하는 범위를 뛰어넘어 훨씬 다양한 역할을 담당합니다. 과학 분야뿐 아니라 일상생활에서 미처 의식하지 못한 채 통계를 빈번하게 이용하기도 합니다. 직관적 판단이나 순간적인 결정처럼, 개개인의 과거의 경험을 통해 확률적으로 가장 가능성이 높은 것을 선택하는 것 역시 그러한 예라 할 수 있겠지요. 따라서 통계학을 이해하고 활용하는 능력을 기른다면 다양한 상황에서 더 정확한 판단과 예측을 할 수 있습니다.

 

하지만 대다수 사람들은 (특별히 관심을 가지고 따로 공부하지 않는 한) 간단한 기초 통계 용어나 개요에도 익숙지 않다 보니 ‘통계는 무조건 어렵다’고 느끼는 경우가 대부분입니다. 특히 복잡한 이론적 배경을 토대로 한 수학적인 통계학 계산은 마치 외계어처럼 느껴질 지경입니다. 이렇게 어려운 파트는 사실 우리가 깊이 고민할 필요가 없습니다. 통계학을 잘 아는 전문가나 과학자들에게 맡기고, 우리는 다만 그 경험과 결과를 실제 우리 생활이나 업무에 활용하는 법을 익히면 됩니다. 그 과정에서 통계학이 결코 어렵기만 한 것이 아니며, 다방면에 걸쳐 매우 큰 도움을 줄 수 있다는 것을 전달하는 것이 이 책의 목적입니다.

 

이 책의 저자는 통계에 익숙하지 않은 사람들도 쉽게 개념을 이해하고 응용할 수 있도록 풍부한 이미지, 도표, 그래프는 물론 귀여운 고양이 캐릭터까지 총동원해 재미있고 쉽게 읽을 수 있도록 책을 꾸몄습니다. 당장 업무나 비즈니스에 통계 지식이 필요하지만 이론은 잘 모르는 사회 초년생이나, 또는 주식이나 부동산 투자 등 개인적인 필요로 통계 기초를 학습하기를 원하는 일반인에게 특히 이 책이 큰 도움이 될 것입니다.

가볍게 통계에 접근할 수 있는 책 

 

이 책을 읽으면서 부분부분 흩어져 있었던 통계학 지식이 하나로 합쳐지는 기분을 느꼈다. 내가 이 책을 들고 다니면서 느꼈던 건 다음과 같다.

얇다.

대부분 통계학 서적들이 정말 두껍다. 특히 요즘 대세가 R이나 Python 같이 코딩과 함께 배우는 추세여서 그런지 책이 배로 두꺼워진 것 같다. 반면 이 책은 지하철에서 들고 읽기 좋았다. 출근길이나. 퇴근길에서 사람들이 많은데도 불구하고, 부담스럽지 않은 딱 좋은 두께였다.

재밌다.

얇은 만큼 전문 내용이 떨어질 것이라 생각했지만, 그렇지 않았다. 오히려, 필요한 부분에 알맞은 내용이 있고 실제 우리 생활에서 쓰이는 예를 들어줘서 학부생 때 배웠던 두꺼운 서적보다. 이해도 잘 되고 뭔가 쉽고 재밌게 다가갈 수 있었다. 아니면 그전에 배워놓게 있어서 그렇게 느낀 건지도 모르겠다.

전체적인 흐름 파악이 가능하다.

이 책은 1장에서 통계를 전체적으로 훑어볼 수 있도록 도와준다. 이후 점점 더 자세하게 하나하나 살펴보는데 이는 통계를 좀 더 멀리서 볼 수 있는 기회를 만들어 준다. 학부생 때는 한 파트 한 파트에 집중해서 전체적인 내용을 중간고사에서 억지로 만들어서 머릿속에 넣었다면 이 책은 먼저 전체적인 내용을 같이 훑어주니까 내용이 자연스럽게 들어오는 느낌이 든다.

결론

고등학생 때부터 대학까지 수학을 꾸준하게 해서 이미 다 알고 있다면 이 책이 그렇게 필요 없겠지만, 나처럼 수포자였다가 통계를 다시 한번 보고 싶은 사람이라든지 아니면 정말 몰라서 통계에 대해 접근하고 싶을 때 가볍고 재밌게 접근하기에 딱 좋은 것 같다. 전체적으로 통계를 돌아볼 수 있게 해주고 실제 어디에 쓰이는지 예를 정말 잘 들어줄 려고 하는 작가의 노력이 돋보였다. 통계학을 어디서부터 접근해야 할지, 어떻게 접근해야 할지 모르겠다면 일단 이 책으로 시작하는 게 어떨까?

 

비즈니스 인텔리전스 시스템을 개발하고 운영하다가 빅데이터와 인공지능 데이터 아키텍처를 다루게 된 컴퓨터공학 전공자로서 통계에는 항상 갈등을 느껴 왔습니다. 통계용어에는 익숙해진 지 오래지만 체계적으로 배운 적은 따로 없었던 상태에서 전공서적은 꽤 어려웠습니다. 스스로 잘 이해했는지 의구심이 많이 들기도 했습니다.

 

그러다 마침 한빛미디어의 <이렇게 쉬운 통계학>을 만났습니다. 기대를 많이 했습니다. 다 읽고 난 뒤의 느낌은 '역시 쉽지 않다'였습니다. 물론 이 책은 제가 읽었던 통계학 서적 중에서 참 쉬운 축에 속합니다. 더불어 꽤 분명한 미덕이 있기에 통계를 독학하거나 어느 정도 감을 잡고 싶다면 추천하겠습니다.

 

이런 종류의 책이 그렇듯 몇 군데 책을 놓을 만한 어려운 곳이 있습니다. 평균, 중간값, 최빈값 얘기가 계속 이어지다가 분산과 정규분표로 바로 넘어가는 듯하게 느껴지기도 합니다. 하지만, 이 책은 주인공이 없지만 확실히 스토리를 가지고 있습니다. 통계학이란 무엇인지 훑어보고 모집단의 특징을 도출하여 가설을 세우고 검증하는 스토리입니다. 통계라는 업의 본질을 느끼게 해 주려고 저자가 노력한 게 느껴지는 듯합니다. 중간중간 계속 읽기 힘들다는 생각이 들면 완벽히 이해하겠다는 부담은 내려놓고 다음 장으로 넘어가도 좋겠습니다.

 

이 책은 다른 통계책에 비해 짧게 다루는 주제가 꽤 있습니다. 가설검정이 대표적입니다. 저자의 의도는 이해가 갑니다. 길게 얘기하는 게 취지와 맞지 않아서일 것입니다. 조던 엘렌버그가 지은 <틀리지 않는 법>은 가설검정 얘기를 좀 길게 하는 편입니다. 두 저자가 비전공자를 대상으로 이 주제를 다루는 접근법이 달라 좀 흥미로웠습니다. 어쨌든 <틀리지 않는 법>은 책 두께가 남자 어른 손가락으로 두 마디는 됩니다. 글꼴 크기도 <이렇게 쉬운 통계학>에 비해 살짝 작습니다. 모셔두기 십상인 <틀리지 않는 법>보다 <이렇게 쉬운 통계학> 쪽이 저자가 의도한 바를 독자에게 전달한 효과가 크지 않을까 합니다. 물론 둘 다 후회 없이 좋은 책입니다.

 

다만 이 책은 다 읽고 난 뒤에 이제부터 뭘 해야 할지 고민이 됩니다. 에필로그에 직감이 얼마나 틀릴 수 있고 통계가 얼마나 중요한지 얘기했으면서도 이 책 이후에 할 것을 알려주지는 않습니다. 다행히 한빛미디어는 책표지 오른쪽 날개에 이어서 읽을 책을 추천해 주었습니다. 저는 이 , <처음 배우는 딥러닝 수학>, <데이터 과학을 위한 통계>, <헬로 데이터 과학> 중에서 <헬로 데이터 과학>을 제일 추천합니다. 비전공자를 대상으로는 제일 쉬운 다음 단계라고 보기 때문입니다. 그 다음으로는 <엑셀만 알아도 할 수 있는 데이터 과학>을 권합니다. 통계를 써먹어 보고 싶어 근질근질할 텐데 이 책을 통해 실제로 뭔가 해볼 수 있습니다. 길게 설명하지 않은 통계용어도 앞서 읽은 책에서 충분히 익숙해졌기에 어려울 게 없을 겁니다. 그 이후에는 R이나 파이썬도 할 마음이 생길지도 모르겠습니다. 화이팅입니다.



출처: https://www.wizmusa.net/1170964307 [전산쟁이 wizmusa의 IT 이야기]
비즈니스 인텔리전스 시스템을 개발하고 운영하다가 빅데이터와 인공지능 데이터 아키텍처를 다루게 된 컴퓨터공학 전공자로서 통계에는 항상 갈등을 느껴 왔습니다. 통계용어에는 익숙해진 지 오래지만 체계적으로 배운 적은 따로 없었던 상태에서 전공서적은 꽤 어려웠습니다. 스스로 잘 이해했는지 의구심이 많이 들기도 했습니다.

그러다 마침 한빛미디어의 <이렇게 쉬운 통계학>을 만났습니다. 기대를 많이 했습니다. 다 읽고 난 뒤의 느낌은 '역시 쉽지 않다'였습니다. 물론 이 책은 제가 읽었던 통계학 서적 중에서 참 쉬운 축에 속합니다. 더불어 꽤 분명한 미덕이 있기에 통계를 독학하거나 어느 정도 감을 잡고 싶다면 추천하겠습니다.

이런 종류의 책이 그렇듯 몇 군데 책을 놓을 만한 어려운 곳이 있습니다. 평균, 중간값, 최빈값 얘기가 계속 이어지다가 분산과 정규분표로 바로 넘어가는 듯하게 느껴지기도 합니다. 하지만, 이 책은 주인공이 없지만 확실히 스토리를 가지고 있습니다. 통계학이란 무엇인지 훑어보고 모집단의 특징을 도출하여 가설을 세우고 검증하는 스토리입니다. 통계라는 업의 본질을 느끼게 해 주려고 저자가 노력한 게 느껴지는 듯합니다. 중간중간 계속 읽기 힘들다는 생각이 들면 완벽히 이해하겠다는 부담은 내려놓고 다음 장으로 넘어가도 좋겠습니다.

이 책은 다른 통계책에 비해 짧게 다루는 주제가 꽤 있습니다. 가설검정이 대표적입니다. 저자의 의도는 이해가 갑니다. 길게 얘기하는 게 취지와 맞지 않아서일 것입니다. 조던 엘렌버그가 지은 <틀리지 않는 법>은 가설검정 얘기를 좀 길게 하는 편입니다. 두 저자가 비전공자를 대상으로 이 주제를 다루는 접근법이 달라 좀 흥미로웠습니다. 어쨌든 <틀리지 않는 법>은 책 두께가 남자 어른 손가락으로 두 마디는 됩니다. 글꼴 크기도 <이렇게 쉬운 통계학>에 비해 살짝 작습니다. 모셔두기 십상인 <틀리지 않는 법>보다 <이렇게 쉬운 통계학> 쪽이 저자가 의도한 바를 독자에게 전달한 효과가 크지 않을까 합니다. 물론 둘 다 후회 없이 좋은 책입니다.

다만 이 책은 다 읽고 난 뒤에 이제부터 뭘 해야 할지 고민이 됩니다. 에필로그에 직감이 얼마나 틀릴 수 있고 통계가 얼마나 중요한지 얘기했으면서도 이 책 이후에 할 것을 알려주지는 않습니다. 다행히 한빛미디어는 책표지 오른쪽 날개에 이어서 읽을 책을 추천해 주었습니다. 저는 이 <처음 배우는 딥러닝 수학>, <데이터 과학을 위한 통계>, <헬로 데이터 과학> 중에서 <헬로 데이터 과학>을 제일 추천합니다. 비전공자를 대상으로는 제일 쉬운 다음 단계라고 보기 때문입니다. 그 다음으로는 <엑셀만 알아도 할 수 있는 데이터 과학>을 권합니다. 통계를 써먹어 보고 싶어 근질근질할 텐데 이 책을 통해 실제로 뭔가 해볼 수 있습니다. 길게 설명하지 않은 통계용어도 앞서 읽은 책에서 충분히 익숙해졌기에 어려울 게 없을 겁니다. 그 이후에는 R이나 파이썬도 할 마음이 생길지도 모르겠습니다. 화이팅입니다.

 

 

KakaoTalk_20190414_225251504.jpg

 

 

다 읽고난 후, 느낌은 
막연하게 통계학이라는 것이 접근하기 어려웠던 독자들이 쉽게 접근할 수 있도록 도와주는 책!" 
이라고 한 마디로 소개할 수 있을 것 같다. 

  
저자가 서문에서 밝혔듯이, "누구나 이해하기 쉽게 설명해주기 위한 책"을 쓰는 것을 목표로 했다는 말이 확 와닿았다고 할까? 
그래서 복잡한 수식과 이론을 통해 통계학을 설명하는 것이 아니라, 
두 사람이 문답하는 방식으로 독자들이 궁금해할 법한 내용과 놓치기 쉬운부분들에 대해 콕콕 찝어서 설명해주고 있다. 
마치 어렸을 적, 과학/수학 만화를 보는 느낌이 든다. 
실제로 책에는 글만 있는게 아니라, 통계학에 관한 내용들을 이미지화하여 독자들의 이해를 돕기 위한 그림도 많이 있다 
(이게 아마 이 책의 가장 큰 장점이지 않을까 싶다) 
  


그리고 꼭 입문자뿐만 아니라, 통계학 기초를 빠르게 ͛어보고 싶은 사람에게도 좋은책이라는 생각도 들었다. 
모든 내용은 아니지만, 전반적으로 기초 통계를 ͛고 있는 느낌을 받았기에 
키워드 중심으로 체크하며 아는 내용은 리마인드하고, 
기억이 가물가물하거나 헷갈리는 내용은 다시 찾아보고 공부할 수 있도록 구성되어 있다는 느낌을 받았기 때문이다. 

하지만, 개인적으로 아쉬운점은 저자가 편집과정에서 주변 사람들에게 물어보면서 
수식이 들어가면 어렵다"는 피드백을 많이 받았기에 
뒤쪽 파트 중에 수식이 들어가야 설명이 되는 부분들은 '키워드만 언급'하는 식으로 설명을 하고 넘어가는 경우가 종종 있었다는 점이다. 
(물론, 타켓층이 '누구나'이기 때문에 그럴 수 밖에 없다는 생각이 든다) 


그래서 추가적으로 책에서 나온 내용을 더 깊게 공부하고 싶은 분들은 따로 자료를 찾아보면 될 것 같다. 
  

저자는 말합니다. 
통계학을 공부했을 때의 이점은 
통계학으로 '성공 확률을 높이는 방법'을 몸에 익힐 수 있다는 것이라는 걸요. 
그러니, 너무 어렵게 생각하지 말고 한걸음씩 통계학에 다가가면서 친해져 보는건 어떨까요? 

undefined

 

'이렇게 쉬운 통계학'은 평소 당연하게 사용하는 대표값(평균, 중앙값, 최빈값), 표준편차, 정규분포 등을 다시 한번 의미를 생각해보고 사용할 수 있도록 잘 정리된 책입니다.

 

데이터를 이해하고 잘 사용하기 위해서는 기초 통계에 대한 이해가 필수라고 생각합니다. 이 책은 누구나 쉽게 기초 통계를 다시 시작할 수 있도록 친절하게 도와줍니다. 

 

20190414_214140.jpg

 

이해가 어려울 수 있는 부분도 예를 들어서 쉽고 간단하게 이해할 수 있도록 설명하고 있습니다. 각 챕터도 2~3장 정도로 이루어져 있어서 흥미를 잃지 않고 끝까지 술술 읽어 나갈 수 있었습니다.

 

정말 쉽고 간단하게 기초 통계를 설명하고 있기 때문에, 평소에 데이터를 다루시는 분이시라면 한번 꼭 읽어보시길 추천드립니다.

0. 빅데이터, 인공지능, 통계지식이 필요하다.

요새 빅데이터, 인공지능 기술에 관심이 많아 지면서, 이 분야의 일자리가 수요가 폭발적으로 증가하고 있습니다. 그리고 이와 관련해서 너무도 많은 강좌들이 만들어지고, 급기야 이제는 사람들이 뭐 부터 시작해야 할지 혼란을 느낄 정도 그 수가 방대해지고 있습니다. 책도 마찮가지 상황입니다. 서점에 책을 사러 가면, 색션이 생길 정도 많은 책들이 출간되고 있습니다.

전, 데이터 사이언스로써 공부를 준비할 때, 통계학을 꼭 공부하라고 조언을 합니다. 그 이유는 결과를 분석하고, 추리할 때 통계학을 사용하지 않을 수 없기 때문입니다. 물론 머신러닝에서도 관련 지식이 필요하지만, 사실은 데이터 분석, 소위 우리가 말하는 빅데이터 분석을 할 때 이용되는게 통계분석입니다. 즉 많은 데이터를 통해서 그 데이터가 함의하고 있는 성향, 성질을 분석하는 학문에 통계학이므로, 빅데이터에서는 빠질 수 없는 지식입니다.

1. 그럼 통계학을 공부할 때 어떻게 해야할까요?

저의 경우에는 쉬운 책, 그리고 성질을 자세히 설정해 주는 책을 고르라고 합니다. 그리고 이 경우 수식이 되도록 많이 없을 것이고, 대신 사례가 많을 것이라는 이야기도 해주죠. 잉?

통계학을 공부하면, 사람들이 먼저 생각하기 쉬운 것이 수학입니다. 물론 통계학은 수학이 맞습니다. 그렇지만, 통계학을 이용하는 방법, 즉 통계 분석은 이우리가 종이에 수식을 적고, 계산을 통해 산출해야하는 것이 아니며, 실제 현장에서도 그렇게 사용하지 않습니다. 그렇지만, 다수의 책들은 수식을 사용해, 통계학만을 가르치는데 집중합니다. 그러나 데이터를 분석하는 사람들은 조금은 다른 관점으로 접근을 해야 합니다. 실무에서는 통계학 자체에 대해서 궁금한 것이 아니라 통계적인 분석 결과물을 얻고 싶은 것이기 때문이죠.

하지만 이렇게 책을 쓴다는 것은 정말 어렵습니다. 이는 수식을 이야기 하지 않으면서, 통계학을 말하는 것과 비슷하기 때문입니다. 분명한 사실은 이러한 내용을 잘 설명하기 위해서는 원리를 정확하게 알고 있어야 합니다. 또한 실제 이를 정학하게 짚고 설명할 수 사람이 책까지 내야 기는 쉽지 않을 테니 도서관이나 서점에서 찾기는 사실 쉽지 않습니다.

하지만, 다행히 최근에 이러한 책들이 빅데이터 분석이 주목을 받게 되면서 다수 출간되고 있고, 해외 좋은 책들이 국내에 번역되어 출간되고 있습니다. 오늘 소개할 책 또한 바로 그런 책입니다.

 

 

20190414_162739.jpg

 

 

 

2. 이렇게 쉬운 통계학

이 책은 앞 부분인 들어가면 부분을 읽으면, 제가 앞서 이야기 한 부분에 대해 작가가 많은 고민과 시행착오를 격고 책을 쓰게 된 것을 이야기 하고 있습니다. 작가 스스로도 이렇게 말을 했다고 합니다.

"편집자님, 통계학이나 통계/확률에 관해서는 쓸 수 있지만, 통계분석은 무리입니다. 그건 수학이 아니거든요" ㅎㅎㅎ

이 책은 크게 다음과 같은 구성을 가지고 있습니다.

첫째, 통계학을 어떻게 사용하는 거지? ~ 프롤로그 : 스레기 데이터로는 쓰레기 분석밖에 나오지 않는다!

둘째, 통계분석의 접근하는 지도? ~ 통계학의 구조, 그리고 원리, 기술통계핵, 추측통계학, 베이즈 통계학 - 1장

셋째, 통계분석에 데이터? ~ 데이터와 그래프처리에서 큰 실수 피하기 - 2장

넷째, 기술통계 - 평균과 분산이해하기 - 3장

다섯째, 추측통계 - 정규분포 체감하기, 표본을 이용하여 모집단의 특징 추정하기, 가설을 세우고 올바른 가설인지 확률로 판단하기 -4장,5장, 6장

이 책은 통계분석이라는 무서운 이야기를 보다 손쉽고 간단하게 설명하려 합니다. 그리고 시간이 되면 한번 쯤 정리해야지 하는 마음이 있는 독자들에게 책 그 자체를 읽으므로써 정리 할 수 있도록 도와주는 길잡이 역할을 해줍니다.

 

 

 

특히 쉬운 사례, 도표는 지하철이나 버스를 타고, 출퇴근하는 상황에서, 편하게 머리속에 정리할 수 있는 기회를 제공해 줍니다. 또 이 이해하기 쉽게 풀어 설명하는 방식으로, 큰 시간을 들이지 않아도, 금방 읽을 수 있도록 되어있습니다. 이틀 정도면 천천히 한번 정도 읽을 수 있는 정도 입니다. 저의 경우에는 틈틈히, 반복해서 읽어 주었습니다.

이 책은 특히 일반인들이 추측통계에서 어려워 하는 부분들은 쉽게 설명하고 있어, 빠르게 실무에 활용이 필요한 분들이나, 회사에서 프로젝트로, 지식이 필요한 분들에게 적절한 책인것 같습니다.

3. 맺음말

통계분석 방법은 회사에서 반복해서 사용하는 것이 아니기 때문에 계속 감각을 유지하기가 쉽지 않습니다. 그러다 보니, 다시 지식을 유지하는 것도 일부러 공을 들이지 않으면, 유지하기가 힘들죠. 특히 통계분석은 프로젝트가 진행되는 중간중간에 긴급을 요하는 상황에서 이뤄지는 경우가 많아. 적절하게 사용하기 위해서는 꾸준히 지식에 대한 감을 유지시켜 주어야 합니다. 그렇지 않으면 설익은 상태에서, 적용하게 되고, 실수가 쉽게 들어날 수 있어, 큰 낭패를 볼 수도 있습니다. 이 책은 통계분석의 스킬을 얻기 위한 사람에게도 좋은 책이지만, 이처럼 유지하고 싶고, 정확하게, 활용하고 싶은 사람들에게도 큰 도움이 될 수 있는 것 같습니다. 저도 몇일동안 주변에 계속 끼고 반복해서 읽게 되네요 ^^;

 

5510.jpg

 

고등학교 시절 배웠던 수학을 돌이켜보면 통계는 가장 맨 마지막에 나왔다.

시험에는 미적분, 확률까지만 나오고 통계는 잘 출제가 되지 않다보니 통계를 잘 공부하지 않았었다. 하지만 사회생활을 하다보니 통계가 주위에서 많이 활용된 수학이었다.

 

이 책은 통계학을 데이터 분석이 아닌 사람을 위한 통계학을 목표로 만들어진 책이다. 처음엔 통계를 다룬다고 해서 수학책인 줄 알았는데, 책 내용은 꼭 그렇지만은 않다. 물론 통계를 다루니 수학관련 내용이 많지만 우리 실생활에서 볼 수 있는 내용들이 통계와 얼마나 연관이 있는지에 대한 내용이다.

 

​프롤로그에서는 독자들에게 통계학이 어떤 학문인지 친절하게 소개한다.

흔히 통계학책은 평균이나 분산을 중심으로 다루는데, 데이터에 대해서는 의심을 품지 않는다. 하지만 통계의 소스가 쓰레기 데이터라면 쓰레기 결과 밖에 나오지 않는다. 저자는 독자들이 편하게 접할 수 있도록 두 사람의 대화를 보여주며 통계학에서 데이터의 중요성을 강조하고 있다.

 

특히 저자는 구글 수석 이코노미스트 할 바리안의 말을 인용해 이후 10년간 가장 매력적인 직업은 통계학자라고 전한다. 개인적으로 우스개 소리로 넘기고자 했는데, 우스개 소리가 아닌 것이 얼마전부터 사람들은 빅데이터라는 용어를 많이 접했다.

빅데이터를 분석하여 이용자의 성향 및 패턴을 분석해 사람들에게 보다 편하고 적합한 서비스를 제공하고자 업계에서는 가장 핵심적인 기술로 여기고 있다. 그러기에 앞으로도 통계학자는 매력적인 직업이 될 것이 분명하다. 

 

책 내용

 

1장 급할수록 서두르자. 통계학 훑기

저자는 통계학의 길은 길고 험한 길이라고 밝힌다. 그래서 중도에 포기도 쉬운데, 독자들에게 편안히 전달하고자 통계학의 전체적인 윤곽을 1장에서 설명하고 있다. 독자들은 처음에 나와있는 통계학 지도를 유심히 보면서 해당 장을 보면 좋을 것 같다. 

 

2장 데이터와 그래프 처리에서 큰 실수 피하기

2장에서는 데이터의 형태를 잘못 파악했을때 큰 오류를 범할 수 있기 때문에 실수를 줄이기 위해 데이터의 형태를 살펴보고 그래프로 처리 시 유의사항을 설명하고 있다.

 

3장 평균과 분산 이해하기

3장에서는 통계의 기본이라 할 수 있는 평균, 분산, 표준편차를 설명하고 있다.

그림과 그래프로 쉽게 설명하고 있어서 무리없이 이 장을 진행할 수 있다. 이 장의 마지막에 통계학 세미나에서는 일기예보의 '평년 기온'에 대한 설명이 나온다. 평년 기온이라는 단어를 봤을 때 평균값의 비교라고 생각하기 쉬우나 평균값이 아닌 중앙값의 의미를 가진다고 한다.

 

4장 정규분포 체험하기

정규분포란 간단히 설명해서 일상에서 흔히 보는 일반적인 분포의 의미이다.

이 장에서는 정규분포에 대해서 얘기하고 최종적으로 다른 집단간의 비교까지 다루고 있다. 정규분포는 데이터를 기반으로 도수분포표를 만들고, 그 표를 가지고 히스토그램을 작성하면 정규분포를 확인할 수 있다. 이 장 중간에서는 사용자들에게 엑셀을 통하여 정규분포를 만드는 방법도 소개하고 있다. 

참고로 정규분포 함수는 NORM.DIST(x값, 평균, 표준편차, TRUE/FALSE)

마지막 인자를 TRUE로 하면 정규분포의 누적곡선을 그릴 수 있다.

 

​5장 표본을 이용하여 모집단의 특징 추정하기

6장 가설을 세우고 올바른 가설인지 확률로 판단하기

5장과 6장에서는 추측통계학에 대한 설명이다. 

5장에서는 모집단의 구체적인 값을 추정하는 방법을 설명하고, 6장에서는 모집단에 대한 가설의 옳고 그름을 가리는 것을 설명한다. 우리가 많이 보았던 TV시청률이나 설문조사 통계도 이를 기반으로 계산된다고 보면 된다.

 

​우리가 실제로 체감하지는 못하지만 우리 주변에서 통계학은 정말 많이 사용되고 있다. 신용카드 업계에서도 사용자의 카드 사용 데이터를 기반으로 고객들에게 서비스를 제공하고 야구에서도 선수들의 데이터를 기반으로 하여 실제 경기에서 많이 활용된 건 꽤 오래되었다. 시청률이나 설문조사의 통계도 흔히 볼 수 있는 형태이다. 이렇듯 우리는 통계와 점점 더 밀접한 관계를 가지고 있으며, 그 데이터가 신빙성 있는지는 통계학을 조금만 들여다 보면 알 수 있을 것이다. 그런면에서 '이렇게 쉬운 통계학'은 안성 맞춤의 통계학 책이다.

한빛미디어 "이렇게 쉬운 통계학"

 

 

수학은 스트레스일까?

 

요즘도 비슷한 커리큘럼인지 모르겠지만 공과대학을 다니면서 배웠던 전공 과목중에 "확률통계" 가 있었다. 명색이 공대생이었지만 고등학교 시절부터 "수학은 나와 관계 없는 학문인거 같아"라고 생각했기 때문에 미분적분학부터 시작하여 공업수학, 확률통계학 등은 무척 괴로웠다는 기억이 가득하다.

 

작년 회사 동료들과 함께 코세라(Coursera)에서 머신러닝 기초 과정을 들으면서 "확률과 통계가 이렇게 쓰이네?"하는 생각을 무척 많이 했다. 그러면서 어렴풋이 했던 생각이 "수학을 좀 다시 들여다 보고 싶어졌어" 였다. 물론, 그 이후 실천 없이 시간이 흘렀고 한빛미디어에서 출간한 "이렇게 쉬운 통계학"을 보기 전까지 수학을 다시 들여다 본적은 1초도 없긴했다.

 

 

이것 참 쉽다냥.

 

 

쉽다. 술술 읽힌다.

 

일본에서 나온 서적들이 기초적인 내용들에 대하여 손쉽게 이해하는데 도움이 된다는 이야기는 여기저기서 많이 들었던 것 같다. 다만, 스스로 그 이야기를 이해할 수 있었던 것이 이번이 처음이라는 것에 한 번 놀랐고, 나의 게으름에 한 번 더 놀랐다. 그리고, 이 책에서 중요하면서 기초적인 통계의 용어나 개념을 "더하기 빼기란?" 보다 쉽게 알려주는 것에 마지막으로 한 번 더 놀랐다.

 

대량의 데이터와 모델링을 기반으로 하는 머신러닝이 소화해 줄 수 있는 영역인지는 모르겠지만 생업으로 삼고 있는 트레픽 엔지니어링에서 매년 한번 씩 돌아오는 스트레스가 미래 트레픽에 대한 예측이다. 패턴화 하기 힘든 것이 제품의 출시 일정이고 이에 대한 사람들의 반응이기 때문에 "과연 미래의 트레픽은 예측할 수 있을까? 학습으로 커버가 가능할까?"의 의심이 많은 편이다.

 

이런 의심은 결국 스스로 확보된 데이터와 휴리스틱하게 판단해야 하는 많은 외부 요인을 통찰력 있게 바라보고 숫자를 만들어 나가야 하는 부담으로 다가온다. 만들어낸 숫자를 보다 합리적으로 보일 수 있도록 해야 하는 것, 이 부분을 일반적이고 기초적인 통계학에서 찾아볼 수 있지 않을까 하는 기대로 이 책을 즐겁게 읽었던 것 같다.

 

 

닭 볏 그래프는 나이팅게일의 아이디어!

 

 

만족스럽다. 여러가지 관점에서.

 

사람마다 다르겠지만 책을 읽는 즐거움 중의 하나는 어딘가에서 썰을 풀어낼 수 있는 백데이터(Backdata)를 제공받는 거라 생각한다. 이미 다들 알고 있는 내용도 당연히 있겠지만, 누군가 -나처럼- 처음 이야기를 듣는 사람들이 "오? 진짜?" 하는 반응을 보일 수 있는 아이템들을 이 책에서 꽤 많이 얻었다. 나이팅게일의 닭 볏 (우리말의 공식 용어인지는 모르겠다) 그래프가 대표적인 예이다.

 

중간에 짧게 소개되는 엑셀의 통계 관련 함수들 역시 무척 흥미로웠다. 엑셀이 만능의 도구라는 것은 익히 알고 있으며 (수혜자 중 한명이다) 근래에는 머신러닝에 써먹는 사람도 많다는 이야기를 들어오기도 했지만, 정규분포 함수와 같은 것들이 기본적으로 제공될거라는 생각은 전혀 해본적이 없었다. 액셀은 정말 데이터를 다루는데 있어서 파이썬 보다도 접근이 쉽고 유용하며 비용 효율적인 툴임을 다시 한 번 알게 되었다.



결제하기
• 문화비 소득공제 가능
• 배송료 : 2,000원배송료란?

배송료 안내

  • 20,000원 이상 구매시 도서 배송 무료
  • 브론즈, 실버, 골드회원이 주문하신 경우 무료배송

무료배송 상품을 포함하여 주문하신 경우에는 구매금액에 관계없이 무료로 배송해 드립니다.

닫기

리뷰쓰기

닫기
* 상품명 :
이렇게 쉬운 통계학
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
이렇게 쉬운 통계학
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
이렇게 쉬운 통계학
구입처*
구입일*
부가기호*
부가기호 안내

* 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?

자료실

최근 본 상품1