本文翻译自 Spark 官方文档 1.2.1
2021年05月12日
2021年05月10日
2021年04月30日
2021年04月30日
2021年04月30日
本书面向初学者介绍了常用大数据框架的使用。
2021年11月17日 RDD 全称为 Resilient Distributed Datasets,是 Spark 最基本的数据抽象,它是只读的、分区记录的集合,支持并行操作,可以由外部数据集或其他 RDD 转换而来,它具有以下特性: