7.2 Spark RDD

Spark的核心RDD为Resilient Distribution Dataset,即弹性分布式数据集。Spark的优势就是来自于RDD本身的特性。RDD能够和其他系统兼容,可以导入外部存储系统的数据集。例如HDFS、HBase、或者其他Hadoop数据源。

results matching ""

    No results matching ""