qq741437829 发表于 2018-6-8 09:47

spark dataset的except方法的问题

本帖最后由 qq741437829 于 2018-6-8 09:48 编辑

假如dataset1是

a
a
b
b
c
c
d
d

dataset2是

b
c

那dataset1.except(dataset2)结果是

a
d

虽然结果是从dataset1中把dataset2中的元素去掉了,但dataset1本身也被去重了;

有没有什么办法能够既从dataset1中把dataset2的元素去掉,但dataset1本身的元素不去重呢
页: [1]
查看完整版本: spark dataset的except方法的问题