robertw2011 发表于 2018-6-10 23:00

Spark MLlib学习——综述和Pipeline(转载)

https://www.jianshu.com/p/27db1f14e21a

MLlib是Spark的机器学习lib,目的是让机器学习的实践变得更加简单,总的来说它提供了以下几种工具:

ML算法:分类、回归、聚类和协同过滤等常用学习算法

特征工程:特征提取、转换、降维和选择

Pipelines:创建、评价和调优的ML Pipelines工具

存储:保存和加载算法、模型和Pipeline

实用工具:线性代数、统计、数据处理等

页: [1]
查看完整版本: Spark MLlib学习——综述和Pipeline(转载)