本文翻译自 Spark 官方文档 1.2.1
主要记录了Hadoop各个组件的基本原理,处理过程和关键的知识点等,包括HDFS、YARN、MapReduce等。

作者:PennyWong http://pennywong.gitbooks.io/hadoop-notebook/content/index.html
本书面向初学者介绍了常用大数据框架的使用。
Hadoop、Zookeeper、Hive、HBase、Flume、Kafka、Spark等。