실시간 분석 솔루션을 구축하기 위한 가장 완벽한 지침서
빠른 비즈니스 의사결정을 위해 실시간 분석에 대한 관심이 고조되고 있다. 이 책은 스트리밍 데이터의 분석에서 시각화까지 전 단계를 망라하는 가성비 높은 솔루션을 제시한다. 1부는 아파치 주키퍼, 카프카, 플룸, 스톰, 얀, 삼자, 레디스, 몽고DB, 카산드라 등으로 실시간 분석 서비스를 구성하고 데이터를 처리 및 저장하는 방법을 다룬다. 2부는 SVG와 D3.js를 활용하여 데이터를 시각화하고 모니터링하고 실시간에 맞게 최적화하는 방법을 살펴본다. 실무 관점에서 다양한 기술의 활용 및 구성 로드맵을 제시하여, 나무가 아니라 숲을 볼 수 있게 해주는 책이다.
빅데이터 분석의 새로운 패러다임 실시간 분석 솔루션 구축 가이드
많은 기업이 실시간으로 발생하는 데이터로부터 빠른 비즈니스 인사이트를 얻기 위해 부단히 노력하고 있다. 데이터를 저장한 후 분석하는 기존 배치 방식은 인사이트 확보 타이밍을 제대로 맞추기 어려웠다. 이에 적시에 신속히 중대 의사결정을 내릴 수 있도록 프로세스 시간을 획기적으로 단축해주는 실시간 분석 솔루션에 대한 관심이 고조되고 있다.
이 책은 이러한 트렌드에 맞춰, 스트리밍 데이터의 수집, 전달, 처리, 저장, 시각화까지 실시간 분석의 전 단계를 망라하는 가성비 높은 솔루션을 구축하는 지침을 제공한다. 스트리밍 데이터의 특성을 살펴본 다음(1장), 1부는 아파치 주키퍼, 카프카, 플룸, 스톰, 얀, 삼자, 레디스, 몽고DB, 카산드라 등으로 실시간 분석 서비스를 설계 및 구성하고(2~3장) 데이터를 처리 및 저장(4~6장)하는 방법을 알아본다. 2부는 SVG와 D3.js를 활용하여 데이터를 시각화하고(7~8장), 데이터를 표집하고 추정값을 얻어내는 데 사용하는 통계 기법과 알고리즘을 살펴본다(9~10장). 끝으로 실시간 데이터를 모니터링하고 실시간에 맞게 최적화하는 고급 기법을 살펴본다(11장).
관련 기술이 워낙 많고 빨리 변하다 보니 개별 기술은 알아도 그것을 실무에서 어떻게 사용할지 곤혹스러워하는 경우가 많다. 이에 실시간 처리에 꼭 필요한 기술이 어떤 흐름에 따라 유기적으로 활용되는지 길을 제시해주는 이 책의 가치가 더 크다. 실무 관점에서 다양한 기술의 활용 및 구성 로드맵을 제시하여, 나무가 아니라 숲을 볼 수 있게 해주는 책이다.