首页 > 自考资讯 > 自考知识

数据挖掘有哪些常用的工具?各有什么优缺点,数据挖掘的10大分析方法

头条共创 2024-06-27

传统数据挖掘软件

特殊和通用钻具包括:

-寻求

MineSet

数据库矿工

智能矿工

SAS企业矿工

SPSS 建模器

大数据挖掘工具Mahout

Mahout 是由Apache 软件基金会(ASF) 开发的开源项目。

目标是创建可扩展的数据挖掘算法,开发人员可以在Apache 许可证下免费使用。

Mahout 包括聚类、分类、CF、进化程序等的许多实现。

此外,Mahout 可以使用Apache Hadoop 库有效地扩展到云。

2ee40001541b1e41a94b~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1720083860&x-signature=r4czyIFOax2mERL%2Faj3DrlXCevQ%3D

Mahout的意思是大象饲养员和骑手。

Mahout 名称来自Hadoop 徽标中的大象

Mahout 利用Hadoop 实现可扩展性和容错能力。

Mahout 与Hadoop 家族其他主要成员的关系

2ee2000154659b951e0a~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1720083860&x-signature=e0pXvuiOVOKTtmK6qlglZa3joWY%3D

大数据挖掘工具MLlib

MLlib是一个基于Spark构建的分布式数据挖掘工具,利用Spark对于内存计算和迭代计算的适用性来显着提高性能。

同时,Spark算子丰富的表达能力使得大规模数据挖掘的算法开发变得不那么复杂。

•MLlib 作为Spark 的一部分现已完全包含在Spark 中。

2ee2000154a38161a4e8~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1720083860&x-signature=JmiCUCFEPvzrdz6HE4NEjQFX%2FJE%3D

数据挖掘框架(Spark MLlib)

•MLlib 是常用数据挖掘算法的Spark 实现库,包括相关测试和数据生成器。

•MLlib 目前支持各种常见的数据挖掘问题。

二元分类、回归、聚类、协同过滤和底层梯度下降优化算法。

版权声明:本文由今日头条转载,如有侵犯您的版权,请联系本站编辑删除。

猜你喜欢