IT CookBook, 빅데이터 컴퓨팅 기술

techn***l2021-10-18

wget www.db21.co.kr/bigdata/hadoop.tgz

	--2021-10-18 08:45:39--  http://www.db21.co.kr/bigdata/hadoop.tgzwww.db21.co.kr (www.db21.co.kr)을(를) 해석하는 중... 1.226.84.52접속 www.db21.co.kr (www.db21.co.kr)|1.226.84.52|:80... 접속됨.HTTP 요청을 전송했습니다. 응답을 기다리는 중입니다... 404 Not Found2021-10-18 08:45:39 오류 404: Not Found.

zeldab***l2014-08-29

<<빅데이터 컴퓨팅 기술>>은 빅데이터 컴퓨팅을 기술

“빅데이터”는 현재 정보사회의 발달로 급격히 늘어난 데이터를 이야기한다 이렇게 데이터가 늘어난데에는 텍스트 중심으로만 처리하던 데이터베이스의 증가량보단 이미지, 동영상이 속하는 메타데이터들의 기하 급수적인 증가로 <<빅데이터 기술>>은 빅데이터의 수집/저장/처리가 손쉽도록 만드는 기술, 도구, 알고리즘을 통틀어서 지칭하는 것이다.
ㅁ
프로그래밍 관계자 한번쯤 들어보았고 프로그램과 관련이 없는 사람들도 인식을 하는 정도이며 빅데이터 관련 연구기관은 국가들에서 앞다투어 투자를 많이 할 정도로 이목이 집중이 되는 분야이다. 빅데이터는 현재의 기술 경쟁에서 가장 큰 이슈가 되며 인류에 정보 발달, 수집 능력, 구현 능력의 향상으로 인해 나타난 총체적 결과라고 본다. 따라서 빅데이터 처리기술의 발달과 함께 인류는 좀더 기술적으로 고도의 성장세를 타고 갈 수 있을것이다. 이에 발맞추어 나가기 위해선 빅데이터 리뷰 서적으로 빅데이터가 무엇인지 어느 분야에서 쓰이는지 그 특성을 이해하고 지나가지 않겠는가?

- 책 디자인의 문제점이라면 책 안의 재질과 배치 디자인은 굉장히 좋으나 겉표지의 재질의 두께감이 조금 모자라는 느낌이다. 조금더 손상이 안가도록 두꺼웠으면 하는 바램이 있다.

이번에 “빅데이터”관련해 리뷰할 이 “빅데이터 컴퓨팅 기술”은 다음과 같은 목차를 지닌다.
목차
1부 빅데이터 개요
1장 빅데이터 개념과 처리 과정
1.1 빅데이터 등장 배경
1.2 빅데이터 개념과 속성
1.3 빅데이터 처리 과정과 기술
1.3.1 빅데이터 소스 생성과 수집 기술
1.3.2 빅데이터 저장 기술
1.3.3 빅데이터 처리 기술
1.3.4 빅데이터 분석 기술
1.3.5 빅데이터 표현 기술
1.4 빅데이터 활용 분야와 기대 효과
1.5 빅데이터 시대 준비
1.6 연습문제
1.7 참고문헌

2부 빅데이터 컴퓨팅 기술
2장 빅데이터 수집 및 통합 기술
2.1 개요
2.2 빅데이터 주요 수집 및 통합 기술
2.2.1 Flume플럼
2.2.2 Chukwa척와
2.2.3 Scribe스크라이브
2.2.4 SQOOPSQl-to-hadOOP; 스쿱
2.2.5 Kafka카프카
2.2.6 OpenRefine오픈리파인
2.2.7 JSONJavaScript Object Notation; 제이슨
2.2.8 BSONBinary javaScript Object Notation; 비슨
2.2.9 Thrift쓰리프트
2.2.10 Protocol Buffers프로토콜 버퍼스
2.2.11 Avro에이브로
2.3 연습문제
2.4 참고문헌

3장 빅데이터 저장 및 관리 기술
3.1 개요
3.2 빅데이터 주요 저장 및 관리 기술
3.2.1 S3Simple Storage Service
3.2.2 HDFSHadoop Distributed File System
3.2.3 DynamoDB다이나모DB
3.2.4 MongoDBMONGOus DB; 몽고DB
3.2.5 CouchDBCluster Of Unreliable Commodity Hardware DB; 카우치DB
3.2.6 Cassandra카산드라
3.2.7 HBaseHadoop dataBASE; H베이스
3.2.8 RedisREmote DIctionary System; 레디스
3.2.9 Riak리악
3.2.10 Hypertable하이퍼테이블
3.2.11 ZooKeeper주키퍼
3.2.12 Voldemort볼드모트
3.3 연습문제
3.4 참고문헌

4장 빅데이터 처리 기술
4.1 개요
4.2 빅데이터 주요 처리 기술
4.2.1 Hadoop하둡
4.2.2 Pig피그
4.2.3 Hive하이브
4.2.4 Cascading캐스캐이딩
4.2.5 Cascalog캐스칼로그
4.2.6 Mrjob미스터잡
4.2.7 S4Simple Scalable Streaming System
4.2.8 MapR맵알
4.2.9 Acunu아큐누
4.2.10 Azkaban아즈카반
4.2.11 Oozie우지
4.2.12 Greenplum그린플럼
4.2.13 EC2Elastic Compute Cloud
4.2.14 Heroku히로쿠
4.2.15 R 프로그래밍 언어
4.2.16 Pipes파이프
4.2.17 Mechanical Turk미케니컬 터크; Mturk
4.2.18 Solr/Lucene솔라/루씬
4.2.19 ElasticSearch엘라스틱서치
4.2.20 Datameer데이터미어
4.2.21 InfoSphere BigInsights인포스피어 빅인사이트
4.2.22 InfoSphere Streams인포스피어 스트림즈
4.3 연습문제
4.4 참고문헌

5장 빅데이터 분석 기술
5.1 개요
5.2 텍스트 마이닝 기술
5.3 오피니언 마이닝 기술
5.4 리얼리티 마이닝 기술
5.5 군집화 기술
5.5.1 계층적 군집화 기술
5.5.2 분할적 군집화 기술
5.6 소셜 네트워크 분석 기술
5.7 그래프 마이닝 기술
5.8 빅데이터를 처리하는 기존 알고리즘 변형 기술
5.8.1 도형 세기 알고리즘의 변형
5.8.2 컬럼 빈도수 측정 프로그래밍 방안
5.8.3 소셜 네트워크 통계 방안
5.8.4 네트워크 분석 기법
5.9 최신 빅데이터 분석 연구
5.9.1 데이터 마이닝 연관 규칙을 활용한 빅데이터 알고리즘
5.9.2 빅데이터와 분류 기술
5.9.3 빅데이터와 군집화
5.10 빅데이터 주요 분석 기술
5.10.1 NLTKNatural Language ToolKit
5.10.2 OpenNLP오픈NLP
5.10.3 Boilerpipe보일러파이프
5.10.4 WEKA웨카
5.10.5 Mahout머하웃
5.10.6 scikits_learn사이키트런
5.11 연습문제
5.12 참고문헌

6장 빅데이터 표현 기술
6.1 개요
6.2 빅데이터 주요 표현 기술
6.2.1 Tag Cloud태그 클라우드
6.2.2 Gephi게피
6.2.3 GraphVizGRAPH VIsualiZation software; 그래프비즈
6.2.4 Processing프로세싱
6.2.5 Fusion Tables퓨전 테이블
6.2.6 Tableau타블로
6.2.7 TinkerPop팅커팝
6.2.8 Clustergram클러스터그램
6.2.9 Spatial Information Flow스페이셜 인포메이션 플로우
6.3 연습문제
6.4 참고문헌

7장 빅데이터 플랫폼 기술
7.1 개요
7.2 빅데이터 플랫폼 요소 기술과 구조
7.2.1 빅데이터 플랫폼 요소 기술
7.2.2 빅데이터 플랫폼 구조 및 세부 기술
7.3 빅데이터 플랫폼 관리 기술
7.3.1 가상화 기술
7.3.2 클라우드 환경에서 처리 기술
7.4 빅데이터 워크플로우 컴퓨팅 플랫폼 기술
7.4.1 그래프 기반 빅데이터 응용
7.4.2 그래프 기반 빅데이터 처리 기술
7.5 연습문제
7.6 참고문헌

3부 빅데이터 기술 개발 현황과 실제 구현 예
8장 빅데이터 기술 개발의 현황과 활용
8.1 개요
8.2 국내외 빅데이터 기술 개발 현황
8.2.1 국내 빅데이터 기술 개발 현황
8.2.2 국외 빅데이터 기술 개발 현황
8.3 빅데이터 산업체 현황
8.3.1 EMC
8.3.2 오라클
8.3.3 IBM
8.3.4 SAP
8.3.5 테라데이타
8.3.6 마이크로소프트
8.3.7 코난테크놀로지
8.3.8 솔트룩스(트루스토리)
8.3.9 다음소프트(소셜 메트릭스)
8.3.10 그루터(씨날)
8.3.11 기타 사업체
8.4 빅데이터 활용 사례
8.4.1 공공?정부?과학 분야
8.4.2 정보 통신 분야
8.4.3 소셜 미디어 분야
8.4.4 의료?헬스 케어 분야
8.4.5 도소매 분야
8.4.6 제조업 분야
8.5 연습문제
8.6 참고문헌

9장 하둡을 이용한 추천 시스템의 구현
9.1 개요
9.1.1 협업 필터링과 연관 규칙을 이용한 추천 시스템과 하둡 에코시스템
9.1.2 실습 환경 구축
9.2 협업 필터링 기법과 머하웃을 이용한 구현
9.2.1 협업 필터링 기법의 원리
9.2.2 사용자 기반 추천 엔진의 구현
9.2.3 아이템 기반 추천 엔진의 구현
9.2.4 협업 필터링 기법에서 추가로 고려할 사항
9.3 연관 규칙 기법과 피그, 하이브를 이용한 구현
9.3.1 연관 규칙 기법의 원리
9.3.2 피그를 이용한 연관 규칙 구현
9.3.3 하이브를 이용한 연관 규칙 구현
9.4 추천 시스템의 구현
9.4.1 데이터 준비하기 : u.data
9.4.2 전처리하기 : PHP
9.4.3 단일 아이템 빈도수 구하기 : 샤크
9.4.4 아이템 (A∩B) 조합의 빈도수 계산하기 : 샤크
9.4.5 연관 규칙 계산하기 : PHP와 샤크
9.4.6 데이터 내보내기 : 스쿱
9.4.7 웹 서비스로 추천 기능 구현하기 : PHP
9.5 참고문헌
찾아보기

전체적인 내용을 보면 알겠지만 대부분 리뷰 형식으로 빅데이터가 생성된 환경 부터 빅데이터를 처리하기 위한 기술의 발전 그리고 발전한 빅데이터 처리기술의 A,B,C를 정리해준다.
그럼에도 이 책을 리뷰하게 된 이유중에 하나는 예제로서 현재 분산처리 프로그래밍으로 빅데이터를 처리하는 오픈소스인 하둡을 이용하여 추천 시스템을 구현하는 내용이 포함되어있다. 이 방법이 너무 궁금해서 책을 픽업하게 만들었다. 결과는 꽤나 만족감을 느낄 수 있었다. 웹과 서버를 만들고 책의 예제를 기반으로 데이터를 넣고 공유하는 식의 서비스는 기본적으로 프로그래머들이라면 한번 해본다면 어느정도 최신기술을 한번쯤 예제로라도 구현해보았다는 자부심을 느끼게 해줄 수 있기 때문이다.

빅데이터의 수집 -> 저장 -> 처리 -> 응용의 과정을 알고싶다면 한번쯤 보아두는것이 좋을 것이다.

다시 처음으로 돌아가서 리뷰를 해보자면 빅데이터 설명에 그 특성을 불여 줄이는 말이 있다. 3V,4V,5V라고 있지만 빅데이터의 기본 구성은 3V다. 양(Volume), 다양성(Variety), 속도(Velocity) 그외에도 Veracity(진실성), Value(가치)를 덧붙여 4V, 5V라고도 하지만 빅데이터의 올바른 기본 구성은 3V라고 생각한다. 5V를 굳이 쓸 수 있는 곳을 찾자면 사업 혹은 연구 분석적인 목적으로 사용할때 진실성과 가치를 덧붙여서 사용하면 알맞을 것 같다고 생각을 한다. 이 책 또한 하나의 빅데이터로 취급하고 5V라고 부르고 싶은데 엄청난 리뷰의 양과 다양성 그리고 적절한 시기의 속도와 관련 문헌까지 꼼꼼히 적어놓는 진실성과 가치를 볼수 있다. 한번쯤은 어디서도 쉽게 구하지 못하는 리뷰 논문급이라고 생각하고 읽어봐야한다.

한글은 써있으나 이해를 하지 못하는 장.

내가 주는 책에 별점은 5점 만점에 4.0. 책의 구성, 내용은 좋지만 종합적인 리뷰 형식이다보니 책에 설명되어있는 깊이가 얇다.

마지막으로 책에서 아쉬운 사항은 다음과 같았다.

1. 정보의 비대칭화 : 특정 알고리즘과 툴에 대해 자세한 설명은 널리 알려진 정보와 문서를 조합해서 세세하게 리뷰를 써놓았지만 그 외의 알고리즘과 툴은 제작년도, 제작사, 사용하는 곳만 적어놓는등 너무 간단한 정보만 적어놓은 식이다. 리뷰를 한다면 정보의 구성에 맞추어 같은 레벨까지의 정보를 리뷰를 해주었으면 한다.

2. 책의 순서라면 3부의 빅데이터 기술 개발과 현황부분과 하둡을 이용한 추천시스템의 구현을 나누어놓았으면 하고 현재 기술 개발현황을 1부 2장에 넣었으면 하는 바가 있다. 어디서 쓰이는지 알아야 빅데이터 수집/저장/처리/에 해당하는 관련 기술을 손쉽게 찾아볼 수 있도록 해야하니까 말이다.

3. 하둡 추천 시스템 구현의 플렛폼 단일화 : Mac과 윈도우를 둘다 사용하기에 구현을 따라 진행하는데는 문제가 없었지만 Mac에서 하둡을 실행하고 구현하는 것은 다른 페이지를 검색해서 사용해야한다. 한 플랫폼에 편향적이라고 생각하기에 다른 운영체제도 생각해서 책의 분량이 조금 늘더라도 같이 작성해주었으면 한다.

scu***l2014-08-27

생소하고 난해한 빅 데이터의 개념을 일깨워주는 책!!

▶ 1부 : 빅 데이터 개요

"사회적으로 끊임없이 이슈화되고 있는 빅 데이터란 과연 무엇인가?"에 대해서 빅 데이터 분야에 처음 입문하는 사람들에게 과외 선생님이 학생에게 쉽게 설명해주고 있다. 평소 "빅 데이터 =가공되지 않은 데이터"라고 본인의 머릿속에 들어 있었는데 개요 부분을 읽으면서 생각이 많이 바뀌었다.
특히 빅 데이터를 구성하고 있는 구성요소에 대해서 빽빽한 글자가 아닌 현실에 존재하는 각 요소들을 그림으로 제공해줌으로써 빅 데이터의 개념을 한 번에 깨달을 수 있도록 구성한 점이 1부의 강점이라고 말할 수 있다.

▶ 2부 : 빅 데이터 컴퓨팅 기술

"빅 데이터 컴퓨팅 기술"을 소개하면서 본격적으로 빅 데이터를 어떻게 수집해야 되며, 수집된 빅 데이터를 일련의 가공기술과정을 거쳐 가공한 뒤에 저장 및 관리하는 기술을 소개하고 있다.
사실상 1부까지도 "빅 데이터" 정의에 대한 개념이 워낙 정립이 잘되있어 후반부 내용이 정말 기대됐었는데, 빅 데이터를 수집 및 가공하며 관리하는 다양한 핵심 기술들을 살펴보면서 놀라움을 금할 수 없었다. 그 이유는 분산된 여러 데이터들이 TPO(Time/Purpose/Object)에 맞게 대상에게 제공이 되기위해서는 체계화되고 엄격한 프로세스를 거쳐야만 비로소 대상이 필요한 데이터가 제공이 된다는 점이다.

▶ 3부 : 빅 데이터 기술 개발 현황과 실제 구현 예

① 빅 데이터 기술 개발의 현황과 활용
이 부분에서는 국내/국외 2가지 영역으로 구분하여 실제 빅 데이터 기술 개발 현황에 대해서 일목요연하게 설명을 해놓았다.
국내의 경우, 한국정보화진흥원의 "빅 데이터 분석활용센터"라는 기관을 소개하며 빅 데이터와 관련된 업무내용을 소개하며, 빅 데이터가 실제 IT 현장에서는 어떻게 활용되고 있는지 파악할 수 있도록 구성했다.
국외의 경우, 이름도 들어도 알 수 있는 Microsoft, Oracle, 사업체 영역, SAP, IBM, 국방부, 방위고등연구계획국 등과 같은 여러 기관에서 빅 데이터가 어떻게 연구 및 활용되고 있는지 간략하게 소개를 해줌으로써 본 책을 읽는 독자로 하여금 빅 데이터의 효용 가치를 한단계 더 업그레이드시켜주고 있다.
개인적으로 생각하기에 "빅 데이터 활용"코너가 독자들이 가장 관심을 가지고 두번,세번 정독할 것만 같다는 느낌을 강하게 받았다.
또한 과학, 의료, 소셜 미디어, 정보통신 여러분야에 이르기까지 빅 데이터를 활용사례를 언급하고 있는데, 이는 특정 분야만이 아닌 다양한 분야를 소개하면서 폭넓은 시야를 제공해주고 있어 독자의 눈높이를 한층 더 확장해주고 있는 느낌을 받았다.

② 하둡을 이용한 추천 시스템의 구현
책의 마지막은 하둡에 대해서 깊이 있는 설명이 아닌 하둡의 개념과 전체 그림을 그려주는 내용이라 하둡에 대해서 깊이 있게 파악하고자 하는 독자라면 하둡에 관한 전문서적을 구매해서 따로 보는 것이 좋다고 판단되었다.

ghost8***l2014-08-27

빅데이터 분야라는 숲을 알게해주는 책!!

데이터 마이닝이나 통계적 분석방법과 같은 데이터 분석기법들은 빅데이터가 주목을 받기 전부터 발전해왔다. 빅데이터의 주목 이전에 데이터들은 대부분 큰 규모의 데이터가 아닌 한정된 크기의 샘플링 데이터들이었다. 그러다 점점 데이터의 유입과 수집이 용이해지면서 수집된 데이터의 크기가 커지게 되고, 이를 담을 저장매체의 가격도 떨어지게 된다. 매체의 가격이 떨어짐에 따라 큰 규모의 데이터를 저장하는 데는 큰 문제가 없지만 큰 데이터를 관리 및 분산 처리해줄 기술이 필요하게 되었고, 결국 하둡과 같은 빅데이터 분산 처리 컴퓨팅 기술이 등장하게 되었다.
『빅데이터 컴퓨팅 기술』 이 책은 앞서 지금까지 간략히 설명한 빅데이터 기술의 등장배경부터 개념, 분석기술, 플랫폼 기술 등을 최대한 간결하고 깔끔하게 설명하고 있다. 빅데이터를 처음으로 공부하려는 입문자에게는 빅데이터라는 커다란 숲을 알려줄 것이고, 이미 어느정도 지식이 있는 사람에게는 빅데이터 분야의 기술들을 전반적으로

dmlr***l2014-08-26

빅데이터 컴퓨팅 기술 (한빛아카데미)

빅데이터 컴퓨팅 기술 (한빛아카데미) - 박두순, 문양세, 박영호, 윤찬현, 정영식, 장형석 지음

여름에 책을 접해서 그런지 파란색 표지 디자인이, 매우 맘에 들었다.

책의 표지 디자인을 보고, 시원시원한 책이다라는 느낌을 받았고, 책의 두께를 보고 얇아서 놀랐다.

컴퓨터 서적은 두껍다는 고정관념을 깨주는 책이다.

요즘 화두가 되고 있는 IoT에 관심이 있다보니, 빅데이터나, 클라우드에 자연스럽게 관심이 가게 되었다.

맨 처음 빅데이터라는 용어를 접하였을 때에는 글자 그대로 ‘큰~ 데이터’ 라는 개념으로 알고 있었다.

책 뒤 표지에 ‘방대한’ 빅데이터 기술을 명쾌하게 정리한다! 라고 쓰여 있어,

나처럼 정말 BIC 데이터인 줄 오해 하는 독자가 있을까 염려 스렵다.

하지만 이 책을 보고 단순히 ‘빅’한 데이터라고만 정의 될 수 있다는 것이 아니라는 것을 알게 될 것이다.

누군가가 나처럼 큰 데이터가 빅데이터라고 한다면, ‘빅데이터 컴퓨팅 기술’ 책을 읽어보고 말하자고 하고 싶다.

책은 크게 1부 ‘빅데이터 개요’, 2부 ‘빅데이터 컴퓨팅 기술’, 3부 ‘빅데이터 기술 개발 현황과 실제 구현 예’ 로 나누어져 있다.

책을 보면 빅데이터의 개념부터 하둡까지 포괄적으로 나와 있어, 빅데이터의 개념을 이해하고, 활용방법까지 알 수 있어 매우 유용한 책이다. 다만, 하둡에 대하여 집중적으로 알고 싶은 독자라면 비추천이다. 실제 책의 두께를 보면 알겠지만, 하둡에 대해서 처음부터 끝까지 나와 있지는 않다.

개인적으로 빅데이터 개념에 대한 1부의 내용은 알고 있어, 2부의 빅데이터의 수집통합기술, 저장 및 관리기술, 처리기술, 분석기술, 표현기술, 플랫폼기술이 각 2장부터 7장까지 자세하게 설명하고 있는 점이 매우 좋았다.

또한, 글로 길게 개념을 설명한 것이 아니라, 표, 그림, 다이어그램 등으로 되어 있어 이해 하는데 많은 도움이 되었다. 단원이 끝날 때 마다 나오는 ‘연습문제’는 복습하는데 도움이 되었으며, “텍스트 마이닝 기술을 설명하시오.”, “오피니언 마이닝 기술을 설명하시오”라는 문제가 연달아 출제 되어 있는 것을 보고, 기술사 시험 문제를 받은 듯한 느낌이 들었다.

연습문제 바로 뒤이어 나오는 ‘참고문헌’ 구성은 처음 접해 보았다. 보통 참고 문헌은 책 맨뒤에 수록되어 있는데, 매 챕터마다 제공되어, 빅데이터를 수학하는데 더욱더 도움이 되었다.

akash***l2014-08-26

빅데이터 초입에게 좋은 책!

"빅데이터"라는 단어를 들었을 때 어떤 느낌이 드나요?
최근 몇 년 사이 "빅데이터"라는 키워드는 업계종사자들 뿐 아니라 일반인들에게도 익숙 할 만큼
자주 언급되어 왔는데요. 하지만 이 단어는 익숙하긴 하지만 종사자/전공자가 아닌 이들에게는 두리뭉실한 개념이었습니다.
단어의 형태로 추측할 수 있는 거대한(Big) 데이터(Data) 덩어리 라는 의미로만 파악하는 이들이 대부분일 것입니다.
물론 저에게도 그렇구요. 본 책, <빅데이터 컴퓨터 기술>은 빅데이터가 무엇인지 궁금해하는 이들과
다양하고 방대한 빅데이터 세계에 첫 발을 들여놓을 이들을 위한 책이라고 할 수 있습니다.
빅데이터의 기본 구성인 4V부터 하둡의 활용법까지! 빅데이터를 전체적으로 훑어보기 좋은 책 입니다.
또한 각 장이 끝날때 마다 배치된 연습문제는 앞서 읽는 내용을 상기시켜주고 중요내용을 숙지하게 해줍니다.

본 책은 크게 빅데이터 개념, 기술, 현황 및 구현 이렇게 세 부분으로 구성됩니다.
개인적으로 빅데이터에 대해 앞서 말한 "두리뭉실"한 개념만 가지고 있던 필자에겐
이 책의 2부인 "빅데이터 컴퓨팅 기술"이 백미였다. 본 책의 2부에선 제목에서 알 수 있듯이
다양한 데이터 처리 기술에 대해 알려주는데요. 필자는 프로그래밍 언어에 조예가 깊은 것이 아니기에
기술적인 부분을 읽기에는 다소 어려움이 있었으나 개념적으로는 무척 설명이 잘되어 있습니다.
특히 3장의 빅데이터 저장 및 관리 기술 관련 부분 과 6장 데이터 표현 기술에선
다양한 구성도 및 구조를 도식화 시켜주어 개념적으로 무척 편하게 다가왔습니다.

그리고 5장 빅데이터 분석 기술에선 흔히들 말하는 "데이터 마이닝"에 대해 간단하게 설명을 해줍니다.
기본적인 텍스트 마이닝 부터 최근에 각광받는 소셜 네트워크 분석 까지 간단 명료하게 원리와 과정을 설명하는
이 부분은 빅데이터의 첫 발을 들인 저에겐 무척 흥미로운 부분이였습니다.
평소 별 생각없이 사용되는 우리의 말(자연어). 그 중에서도 한 문장의 단어, 품사 등을 구문별로 분석하여
용어인식 단계를 거쳐 의미를 분류하고 분석하는 과정은 빅데이터의 활용성이 무궁무진하다는 점을 알려줍니다.
이 자연어 처리와 텍스트 마이닝 기술을 잘 보여주는 게 "소셜 매트릭스"(http://insight.some.co.kr/campaign.html) 라는 서비스인데,
키워드를 입력 시 그 키워드와 관련된 다양한 연관어와 속성을 보여줍니다.

이러한 빅데이터의 다양한 활용방법은 본 책의 8장에 현황과 함께 잘 나와있는데요.
정부의 입장에서 기업의 입장에서 빅데이터를 활용해 행정적, 경영적 문제 등을 해결하는 모습을 보면
빅데이터의 가능성을 다시 한 번 실감할 수 있었습니다.

마지막으로 본 책의 끝은 빅데이터 기술의 핵심인 하둡(Hadoop)을 활용한 실제 기술을 배워보고 구현하는 장으로 구성되어 있습니다.
하둡의 실행환경 구축 부터 엔진 구현까지 코드를 따라하며 배우는 방식으로 구성되어 있는 데 구축 부분이 다소 미흡하게 느껴지는데요.
분량 때문인지 "웹에서 찾아보길" 이라고 축약을 해주었는데 개인적으로 이고잉님의 하둡 설명 영상을 추천 드립니다.
빅데이터 관련해서도 간단하게 설명해주시니 꼭 참조해보시면 좋을 듯 합니다.
(http://opentutorials.org/module/417/3702)

제가 현재 Mac을 써서 인지 Mac에서 하둡을 설치하고 실행하는 방법은 여기를 참조해주세요.(http://iltal.tistory.com/3)

요약 : 빅데이터 관련 기술을 전체적으로 알아보고 숙지하고 싶은 분들에게 추천드리는 도서.

fkdtj***l2014-08-20

빅데이터 컴퓨팅 기술을 읽고

빅데이터에 대한 이야기는 많이 들어 왔었다. 작년 말, 빅데이터를 도전한다고 하둡책을 구매한 기억이 난다. 하지만 대 실패..지금 기억으론 왜 그만 두었는지 몰라도 이번 계기로 다시 한번 빅데이터를 건드려 보려 한다.

정말 많은 내용을 차곡차곡 모아 만든 한권의 책이 "빅데이터 컴퓨팅 기술"이란 책이란 생각이 들었다.
빅데이터에 대한 전반적인 내용을 알고자 하는 누군가에게, 그리고 빅데이터를 처음 사용하고자 할 때 어떤 경로를 통해 어떤 종류를 선택해야 할지 모르는 누군가에게 권하고 싶다.

처음에는 얇고 다채로운 색감을 지닌 이 책이 이렇게나 많은 내용을 담고 있을 것이란 기대를 하지 않았다. 하지만 그렇기 때문에 쉽게 책을 선택할 것이고, 이 책을 통해 많은 것을 얻을 수 있을 것이라 예상한다.

1부에서는 빅데이터의 개요를 설명하는 장으로 기본 개념과 처리 과정등 빅데이터를 이해 할 수 있도록 도와주는 장이다. 또한 저장, 처리, 분석 등 빅데이터 처리 과정의 전반적인 개념을 쉽고 간단하게 소개해준다.
2부에서는 빅데이터 컴퓨팅 기술에 대한 본격적인 이야기를 한다. 이 책의 강점이라고 생각하는 부분 중 하나로 관련 기술의 모든 것을 알려준다. 이는 빅데이터를 활용하고자 하는 그 누구에게도 도움이 될 만한 자료라 생각한다. 전체적인 빅데이터 기술에 대한 것을 제공함으로써 빅데이터 기술을 활용하기 위해 효율적인 선택을 할 수 있도록 도와줄 수 있을 것이기 때문이다. 그렇게 2부에서 수집 및 통합 기술, 저장 및 관리 기술, 처리 기술, 분석 기술, 표현 기술, 플랫폼 기술 로 나눠 각 단원마다 간단하지만 자세한 내용을 접할 수 있다.
모든 빅데이터에 대한 기술을 접한 사용자에게 3부에서는 기술 개발 현황과 활용에 관련된 사례를 보여준다. 이에 멈추지 않고 하둡을 이용한 시스템 구현을 다루면서 이론에서 멈추지 않고 실제로 엔진을 구현해보면서 마무리를 하게 된다.

얇지만 방대한 양의 정보를 담고 있는 "빅데이터 컴퓨팅 기술" 책을 시작으로 빅데이터 관련 공부를 시작해도 좋을 것 같다.

자료명	등록일	다운로드
9장 실습 환경설정 변경안내	2019-03-18	다운로드
예제소스	2019-03-18	다운로드

IT CookBook, 빅데이터 컴퓨팅 기술

자료 다운로드시 유의사항

▶ 부록/자료 관련 FAQ