Hadoop徹底入門

今日紹介する本はこちら


目次
Hadoopってなんだろう?
Hadoopの導入
Hadoop分散ファイルシステムHDFS
Hadoop MapReduceフレームワーク
MapReduceプログラミング入門
SQL的インターフェイスHive
環境構築の効率化
運用監視とシステムの可視化
可用性の向上
性能向上のためのチューニング
Hadoopに関連するプロダクト

さすがになんの予備知識もない状態で読みきるのは不可能です。必要とされる予備知識はJavaプログラミングスキル、SQLをいじったことのある経験、それとUNIXですかね。以前にもHadoopの記事を書いたかと思いますが、お手元のPCでできることはできるのです。導入に際しても特に料金もかかりません。あとはどれだけのモチベーションがあるか、ということになります。まあこれは何をやるにしても一緒ですが…。

上記の経験を有した上で読み進めていくと良いかと思います。CDH3の説明が中心ですが、4以降はこちらと合わせて理解するのがお勧めです。

http://www.ne.jp/asahi/hishidama/home/tech/apache/hadoop/index.html

さらにHBaseとPigの説明もあります。Mahoutの説明はありませんので(初版)どこかで知識補充する必要があります。

MapReduceでJavaプログラムをいじる場合はEclipseがあるとやはり便利です。環境変数を設定すれば簡単に連携可能ですのでぜひお試しあれ。

とりあえずは揃えておきたい一冊です。

 

Pocket
このエントリーを Google ブックマーク に追加
LINEで送る
LinkedIn にシェア

コメントを残す