JackPeng 发表于 2018-6-10 20:35

Spark中DataSet算子操作与RDD算子操作的异同

对于学习Spark的同学,对RDD的算子操作并不陌生,而在Spark SQL中,标准的数据单元是DataSet,从数据库中读取的数据可以转化为DataSet类型,Spark为我们提供了很多操作DataSet的算子,这些算子大部分与RDD的算子有着相同的名称和用途,但是在使用细节上有一定的差异,你都见到过哪些DataSet与RDD相同名称但是使用方法不同的算子呢?

页: [1]
查看完整版本: Spark中DataSet算子操作与RDD算子操作的异同