本书面向初学者介绍了常用大数据框架的使用。
2021年11月17日
2021年11月17日
2021年11月17日
2021年11月17日
2021年11月17日 Apache YARN (Yet Another Resource Negotiator) 是 hadoop 2.0 引入的集群资源管理系统。用户可以将各种服务框架部署在 YARN 上,由 YARN 进行统一地管理和资源分配。
2021年11月17日
2021年11月17日 Hadoop MapReduce 是一个分布式计算框架,用于编写批处理应用程序。编写好的程序可以提交到 Hadoop 集群上用于并行处理大规模的数据集。
2021年11月17日 HDFS (Hadoop Distributed File System)是 Hadoop 下的分布式文件系统,具有高容错、高吞吐量等特性,可以部署在低成本的硬件上。
主要记录了Hadoop各个组件的基本原理,处理过程和关键的知识点等,包括HDFS、YARN、MapReduce等。
作者:PennyWong http://pennywong.gitbooks.io/hadoop-notebook/content/index.html
作者:PennyWong http://pennywong.gitbooks.io/hadoop-notebook/content/index.html
2021年12月03日
2021年12月03日
2021年12月03日
2021年12月03日
前一页
后一页