数据挖掘工具是使用数据挖掘技术从大型数据集中发现并识别模式的计算机软件。数据在当今世界中就意味着金钱,但是因为大多数数据都是非结构化的。因此,拥有数据挖掘工具将成为帮助您获得正确数据的一种方法。下面为大家介绍12款常用的数据挖掘工具。

常用的数据挖掘工具

1. R

R是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统;数组运算工具(其向量、矩阵运算方面功能尤其强大);完整连贯的统计分析工具;优秀的统计制图功能;简便而强大的编程语言:可操纵数据的输入和输出,可实现分支、循环,用户可自定义功能。

2. Oracle数据挖掘(ODM)

Oracle Data Mining是Oracle的一个数据挖掘软件。 Oracle数据挖掘是在Oracle 数据库内核中实现的,挖掘模型是第一类数据库对象。Oracle数据挖掘流程使用Oracle 数据库的内置功能来最大限度地提高可伸缩性并有效利用系统资源。

3. Tableau

Tableau提供了一系列专注于商业智能的交互式数据可视化产品。Tableau允许通过将数据转化为视觉上吸引人的交互式可视化(称为仪表板)来实现数据的洞察与分析。这个过程只需要几秒或几分钟,并且通过使用易于使用的拖放界面来实现。

4. Scrapy


Scrapy,Python开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。

5、Weka

Weka作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。

Weka高级用户可以通过Java编程和命令行来调用其分析组件。同时,Weka也为普通用户提供了图形化界面,称为Weka KnowledgeFlow Environment和Weka Explorer。和R相比,Weka在统计分析方面较弱,但在机器学习方面要强得多。

6、八爪鱼采集器

八爪鱼是一款通用网页数据采集器,使用简单,完全可视化操作;功能强大,任何网站均可采集,数据可导出为多种格式。

7、RapidMiner

Rapid Miner,原名YALE又一个学习环境,是一个用于机器学习和数据挖掘实验的环境,用于研究和实际的数据挖掘任务。毫无疑问,这是世界领先的数据挖掘开源系统。该工具以Java编程语言编写,通过基于模板的框架提供高级分析。

8、KNIME

KNIME是一个基于Eclipse平台开发,模块化的数据挖掘系统。它能够让用户可视化创建数据流(也就常说的pipeline),选择性的执行部分或所有分解步骤,然后通过数据和模型上的交互式视图研究执行后的结果。
KNIME中每个节点都带有交通信号灯,用于指示该节点的状态(未连接、未配置、缺乏输入数据时为红灯;准备执行为黄灯;执行完毕后为绿灯)。在KNIME中有个特色功能——HiLite,允许用户在节点结果中标记感兴趣的记录,并进一步展开后续探索。

9、Orange

Orange是一个以Python语言编写的基于组件的数据挖掘和机器学习软件套件。它是一个开放源码的数据可视化和分析的新手和专家。数据挖掘可以通过可视化编程或Python脚本进行。它还包含了数据分析、不同的可视化、从散点图、条形图、树、到树图、网络和热图的特征。

10、IBM SPSS Modeler

IBM SPSS Modeler工具工作台最适合处理文本分析等大型项目,其可视化界面非常有价值。它允许您在不编程的情况下生成各种数据挖掘算法。它也可以用于异常检测、贝叶斯网络、CARMA、Cox回归以及使用多层感知器进行反向传播学习的基本神经网络。

11、Pentaho

Pentaho为数据集成、业务分析以及大数据处理提供一个全面的平台。使用这种商业工具,你可以轻松地混合各种来源的数据,通过对业务数据进行分析可以为未来的决策提供正确的信息引导。

Pentaho整合了多个开源项目,目标是和商业BI相抗衡。它偏向于与业务流程相结合的BI解决方案,侧重于大 中型企业应用。它允许商业分析人员或开发人员创建报表,仪表盘,分析模型,商业规则和BI流程。

12、NLTK

NLTK适用于语言处理任务,因为它可以提供一个语言处理工具,包括数据挖掘、机器学习、数据抓取、情感分析等各种语言处理任务。而您需要做的只是安装NLTK,然后将一个包拖拽到您最喜爱的任务中,您就可以去做其他事了。因为它是用Python语言编写的,你可以在上面建立应用,还可以自定义它的小任务。

以上介绍的几款软件都是非常好的开源数据挖掘软件,各有所长,同时也各有缺点。读者可以结合自己的需求来进行选择,或者组合使用多个软件。

12款常用的数据挖掘工具推荐相关推荐

  1. 12款浏览器兼容性测试工具推荐

    http://lib.csdn.net/article/softwaretest/40340?knId=1309 12款浏览器兼容性测试工具推荐 12款浏览器兼容性测试工具推荐 作者:lhzb8866 ...

  2. 12款国内外企业协作工具推荐

    现在,云计算已经走入了我们的日常工作,也需你还感受不到它的身影,其实不知不觉中,很多人已经在使用各种各样的云服务了,比如百度网盘.快盘等云 存储,还有很多小微企业都在使用的IaaS平台,诸如阿里云.青 ...

  3. java常用压测工具_几款常用压测工具推荐

    ab ab是apache自带的压力测试工具,使用起来非常方便. 安装 如果安装了apache, 那么ab已经安装好了,如果不想安装apache的话,可以通过以下方式安装ab # ubuntu sudo ...

  4. java 压测工具_几款常用压测工具推荐

    ab ab是apache自带的压力测试工具,使用起来非常方便. 安装 如果安装了apache, 那么ab已经安装好了,如果不想安装apache的话,可以通过以下方式安装ab # ubuntu sudo ...

  5. 几款常用UML建模工具解析

    本节向大家介绍几款常用UML建模工具,UML是个好东西,但是过分的依赖于UML也不是一件好事,因为有时候它会把简单的东西复杂化.请看下面详细介绍. 常用UML建模工具 UML不算是个新名词,但是实际中 ...

  6. 几款常用PHP开发工具

    几款常用PHP开发工具 最近想好好研究一下PHP开发,所以搜罗了一下.找了这么几款开发工具和大家共享. 1.EditPlus 一套功能强大,可取代记事本的文字编辑器,拥有无限制的Undo/Redo.英 ...

  7. 7 款优秀 Markdown 编辑工具推荐

    解决作者编辑们的焦虑:7 款优秀 Markdown 编辑工具推荐 什么是 Markdown?简单地说,它就是一种语法,一门适合用于写作的简单语言.用过 Markdown 的人都知道,它的高效在于能有效 ...

  8. python 数据挖掘工具_推荐19款最常用的数据挖掘工具

    数据在当今世界意味着金钱.随着向基于app的世界的过渡,数据呈指数增长.然而,大多数数据是非结构化的,因此需要一个过程和方法从数据中提取有用的信息,并将其转换为可理解的和可用的形式. 数据挖掘或&qu ...

  9. 10款常见常用的自动化测试工具推荐

    当我们功能测试干的时间比较久了或者想要学习更多的技术,提升自己的时候,基本上第一时间就会想到的是自动化测试.而在自动化测试领域,自动化工具的核心地位毋庸置疑,自动化测试工具有哪些?下面为大家推荐10款 ...

  10. 推荐:几款优秀的数据挖掘工具

    [b]TipDM数据挖掘建模工具[/b] 一.产品简介: 顶尖数据挖掘平台(TipDM)是广州泰迪智能科技有限公司自主研发的一个数据挖掘工具,使用JAVA语言开发,能从各种数据源获取数据,建立各种不同 ...

最新文章

  1. eclipse批量修改package、import中的包名
  2. jzoj6375-华灵「蝶妄想」【结论题】
  3. Java SE 8新特性导览:使用Lambda Expression进行函数式编程
  4. 工业交换机都有哪些优势,该如何挑选
  5. 重量级 | 重量级!Maven史上最全教程,看了必懂
  6. JavaTPoint 工具中文教程【翻译完成】
  7. 【?异或】LeetCode 260. Single Number III
  8. GEO-Slope产品
  9. 机器学习-笔试题总结1
  10. 愿天下有情人都是失散多年的兄妹(25分)
  11. asterisk注册河南联通ims
  12. html5单行文本框属性,文本框list属性和文本框autocomplete属性
  13. docker onlyoffice7.1.1 word excel ppt在线编辑、在线预览_部署01
  14. Java 的字节与字符输入/输出流的类整理——zyx笔记
  15. QT做的小游戏,技术成长ing(莫名押韵_dog)
  16. Xftp文件传输失败
  17. 分布式数据库HBase
  18. 海康威视DS-K1F100-D8E发卡器Java版
  19. 【渝粤教育】电大中专电大中专计算机应用基础考试考核石头作业 题库
  20. events和event

热门文章

  1. 银联携手酷客多协助百万商家上线小程序
  2. 耗时86小时的「百变小樱」最强数据可视化作品!
  3. 浅析精益生产中改善活动的8个步骤
  4. 8086汇编基础 8080,8088,8086,80286,80386的地址线,数据线宽度
  5. 96K的3d FPS游戏-毁灭杀手(kkrieger)
  6. cookie 存放位置
  7. 欧拉公式求四面体体积
  8. Hexo 设置博客背景图片 (NexT 主题 )
  9. 快速学会关键路径、最早开始时间和最晚开始时间的计算
  10. 个人通过ipv6地址提供公网访问服务