본문 바로가기
Reviews/읽자

[한빛리더스] 실시간 분석의 모든 것

by Jany 2016. 1. 23.
반응형

한빛리더스 시즌2 2015년 송년회에 참석을 했다.


그랬더니 보너스 미션으로  원하는 신간을 고르라고 햇는데,

보너스인데 미션이니... 좋은 것인지 안좋은 것인지는 잘 모르겠다.ㅎ


내가 번역한 책을 고르려고 하다가...

번역했을때의 추억이 물신물신 떠올라서 결국 다른 책을 고르게 되었다.


회사에서 유튜브 관련 업무를 담당하면서,

자연스럽게 유튜브에 쌓은 로우 데이터에서 의미있는 수치를 찾게 되었고,

그로 인한 빅데이터에 대해 관심을 갖게 되었다.


유튜브에서는 구글 API가 상당히 자세히 잘 되어있기에

데이터 분석 시스템 설계에 대해서는 따로 생각해 본적은 없는데,

나중에 다른 플랫폼으로 확장을 하기 위해서는 꼭 필요하다고 판단되어서 신청하게 되었다.


* Google Developers : https://developers.google.com/products/


실시간 분석의 모든 것
국내도서
저자 : 바이런 엘리스(Byron Ellis) / 이상훈역
출판 : 한빛미디어 2015.12.15
상세보기


이 책은 부제가 '스트리밍 데이터 분석 및 시각화 시스템 구축 가이드' 이다.


상당히 강력한 메시지를 담고 있어서 가볍게 훑어 봤더니 역시나 어려운 내용들이 상당하다.


단순하게는 스트리밍 데이터가 어떠한 것인지 부터

설계를 하기 위해서 어떤 요소를 챙겨야하는지,

어떤 특징을 가지고 있는 언어를 선택해야하는지,

시스템 설계 등에 대한 전반적으로 다양한 내용을 담고 있다.


특히 서비스 구성에서 분산시스템을 위해 주키퍼를 제안하고 있는데,

대부분의 회사들 추세가 오픈소스를 활용하는 것을 생각하면 현실적인 방안이 아닐까 싶다.


또한 주키퍼 뿐 아니라, 플룸, 스톰, 얀, 삼자, 레디스, 카산드라 등을 함께 소개하고 있는데,

하둡과 스파크도 함께 소개가 되었으면 더 좋았을 듯 하다.


물론 어느 하나가 좋다고는 할 수 없지만,

워크로드나 인프라 스트럭처, 상황 등에 따라 스톰과 스파크를

카프카나 하둡 등을 병행하는 것이 최상일 수 있을 듯 하다.


책 뒷부분은 데이터 시각화에 대한 부분이 나오는데,

다른 책을 보면서 한번 다뤘던 부분이라 쉽게 쉽게 넘어갈 수 있었다.


참고

[Reviews/Book] - [한빛리더스] 데이터 시각화를 위한 데이터 인사이트

[Reviews/Book] - [한빛리더스] 엔지니어를 위한 데이터시각화


나름 한달이 넘게 붙잡고 있던 책인데, 생각보다 내용이 많아서

명절 연휴 동안 다시 한번 읽어볼 예정이다.




반응형

댓글