JackPeng 发表于 2018-6-10 20:42

Spark ML第一课技巧总结

其实对于文本中标点符号的处理可以借助正则表达式,而停用词可以从文件读取,再转为list,在DataSet的filter中使用。

绝情G涛涛 发表于 2018-6-10 21:44

停用词转化为list,使用的是什么方式呢?用collectAsList吗?
页: [1]
查看完整版本: Spark ML第一课技巧总结