传统数据挖掘软件
特殊和通用钻具包括:
-寻求
MineSet
数据库矿工
智能矿工
SAS企业矿工
SPSS 建模器
大数据挖掘工具Mahout
Mahout 是由Apache 软件基金会(ASF) 开发的开源项目。
目标是创建可扩展的数据挖掘算法,开发人员可以在Apache 许可证下免费使用。
Mahout 包括聚类、分类、CF、进化程序等的许多实现。
此外,Mahout 可以使用Apache Hadoop 库有效地扩展到云。
Mahout的意思是大象饲养员和骑手。
Mahout 名称来自Hadoop 徽标中的大象
Mahout 利用Hadoop 实现可扩展性和容错能力。
Mahout 与Hadoop 家族其他主要成员的关系
大数据挖掘工具MLlib
MLlib是一个基于Spark构建的分布式数据挖掘工具,利用Spark对于内存计算和迭代计算的适用性来显着提高性能。
同时,Spark算子丰富的表达能力使得大规模数据挖掘的算法开发变得不那么复杂。
•MLlib 作为Spark 的一部分现已完全包含在Spark 中。
数据挖掘框架(Spark MLlib)
•MLlib 是常用数据挖掘算法的Spark 实现库,包括相关测试和数据生成器。
•MLlib 目前支持各种常见的数据挖掘问题。
二元分类、回归、聚类、协同过滤和底层梯度下降优化算法。
版权声明:本文由今日头条转载,如有侵犯您的版权,请联系本站编辑删除。