Taste of Tech Topics

Acroquest Technology株式会社のエンジニアが書く技術ブログ

Hadoopのデザインパターン本を紹介。

どうもはじめまして、上田です。
今年も残すところ後2週間をきり、何か遣り残したことがないか気になる今日この頃。
年末に何か洋書の技術書を読んでみるのもいいのでは、と思っています。

最近は大量データ処理周りの本が目に付く気がします。
あまり大量データとは縁のない私ですが、
Hadoop周りのことは社内で使う人も多いので知っておきたいと思い、
ちょうど一ヶ月ほど前に出たこの本を先輩に薦められて買ってみました。

ついに出た、
Hadoopのデザインパターン
今日はこの本についてざっくり紹介したいと思います。

動物本でHadoopなので象が出てくるかと思いましたが、
見ての通りこれは鹿。一応、四不像という種類の鹿で、
角がシカ、頸部がラクダ、蹄がウシ、尾がロバに似ているが、
そのどれでもないと考えられたことが名前(四不像)の由来という説がある、
そうです。

残念ながら、は入っていません。

本の概要はこんな感じ。

File Size: 4466 KB
Print Length: 256 pages
Simultaneous Device Usage: Unlimited
Publisher: O'Reilly Media; 1 edition (November 21, 2012)
Sold by: Amazon Digital Services, Inc.
Language: English

amazonへのリンク↓($32くらいです)
http://www.amazon.com/MapReduce-Design-Patterns-ebook/dp/B00AB61JMQ/ref=sr_1_3?ie=UTF8&qid=1354289371&sr=8-3&keywords=mapreduce+design+patterns

それはさておき、デザインパターンは何が紹介されているのか、
パターンの種類全体を俯瞰するために表を作ってみました。
英訳に慣れていないので、何か直訳っぽい表現が多いのはご愛嬌で。


全23パターン
まとめや構成を説明した章をのぞくと、
ほぼ上記パターンの紹介がこの本の全てを占めています。

一見シンプルそうな集計計算にはかなり力を使って書かれていました。
個人的には、レコードのjoin処理系のパターンが気になっています。

これから気になるパターンをそれぞれ読んでみて、
何か面白いものがあればまた紹介したいと思います。

では今回はこの辺で。