本书面向初学者介绍了常用大数据框架的使用。
2021年11月17日
2021年11月17日 HDFS (Hadoop Distributed File System)是 Hadoop 下的分布式文件系统,具有高容错、高吞吐量等特性,可以部署在低成本的硬件上。
主要记录了Hadoop各个组件的基本原理,处理过程和关键的知识点等,包括HDFS、YARN、MapReduce等。
作者:PennyWong http://pennywong.gitbooks.io/hadoop-notebook/content/index.html
作者:PennyWong http://pennywong.gitbooks.io/hadoop-notebook/content/index.html
2021年12月03日 Hadoop Distributed File System,分布式文件系统