原文作者:Chandan Goopta.  [Chandan Goopta是一名来自加德满都(尼泊尔首都)大学的数据研究专家,致力于为情感分析建立智能算法。]

原文链接:http://thenewstack.io/six-of-the-best-open-source-data-mining-tools/

当今这个时代,说数据就是金钱一点都不夸张。


随着向一个基于应用的领域过渡,数据则呈现出了指数级增长。然而,大部分数据是非结构化的,因此它需要一个程序和方法来从中提取有用信息,并且将其转换为可理解、可用的形式。而在数据挖掘任务中,有大量的工具可供使用,比如采用人工智能、机器学习,以及其他技术等来提取数据。
以下为您推荐六款强大的开源数据挖掘工具:
1、RapidMiner

该工具是用Java语言编写的,通过基于模板的框架提供先进的分析技术。该款工具最大的好处就是,用户无需写任何代码。它是作为一个服务提供,而不是一款本地软件。值得一提的是,该工具在数据挖掘工具榜上位列榜首。
另外,除了数据挖掘,RapidMiner还提供如数据预处理和可视化、预测分析和统计建模、评估和部署等功能。更厉害的是它还提供来自WEKA(一种智能分析环境)和R 脚本的学习方案、模型和算法。
RapidMiner分布在AGPL开源许可下,可以从SourceForge上下载。SourceForge是一个开发者进行开发管理的集中式场所,大量开源项目在此落户,其中就包括维基百科使用的MediaWiki。
2、WEKA

WEKA原生的非Java版本主要是为了分析农业领域数据而开发的。该工具基于Java版本,是非常复杂的,并且应用在许多不同的应用中,包括数据分析以及预测建模的可视化和算法。与RapidMiner相比优势在于,它在GNU通用公共许可证下是免费的,因为用户可以按照自己的喜好选择自定义。
WEKA支持多种标准数据挖掘任务,包括数据预处理、收集、分类、回归分析、可视化和特征选取。
添加序列建模后,WEKA将会变得更强大,但目前不包括在内。
3、R-Programming

如果我告诉你R项目,一个GNU项目,是由R(R-programming简称,以下统称R)自身编写的,你会怎么想?它主要是由C语言和FORTRAN语言编写的,并且很多模块都是由R编写的,这是一款针对编程语言和软件环境进行统计计算和制图的免费软件。R语言被广泛应用于数据挖掘,以及开发统计软件和数据分析中。近年来,易用性和可扩展性也大大提高了R的知名度。
除了数据,它还提供统计和制图技术,包括线性和非线性建模,经典的统计测试,时间序列分析、分类、收集等等。
4、Orange

Python之所以受欢迎,是因为它简单易学并且功能强大。如果你是一个Python开发者,当涉及到需要找一个工作用的工具时,那么没有比Orange更合适的了。它是一个基于Python语言,功能强大的开源工具,并且对初学者和专家级的大神均适用。
此外,你肯定会爱上这个工具的可视化编程和Python脚本。它不仅有机器学习的组件,还附加有生物信息和文本挖掘,可以说是充满了数据分析的各种功能。
5、KNIME

数据处理主要有三个部分:提取、转换和加载。 而这三者KNIME都可以做到。 KNIME为您提供了一个图形化的用户界面,以便对数据节点进行处理。它是一个开源的数据分析、报告和综合平台,同时还通过其模块化数据的流水型概念,集成了各种机器学习的组件和数据挖掘,并引起了商业智能和财务数据分析的注意。 
KNIME是基于Eclipse,用Java编写的,并且易于扩展和补充插件。其附加功能可随时添加,并且其大量的数据集成模块已包含在核心版本中。
6、NLTK

当涉及到语言处理任务,没有什么可以打败NLTK。NLTK提供了一个语言处理工具,包括数据挖掘、机器学习、数据抓取、情感分析等各种语言处理任务。而您需要做的只是安装NLTK,然后将一个包拖拽到您最喜爱的任务中,您就可以去做其他事了。因为它是用Python语言编写的,你可以在上面建立应用,还可以自定义它的小任务。

如需转载请注明本文链接及作者,望各位友人能够尊重个人劳动成果。

极好的六个开源数据挖掘工具相关推荐

  1. 推荐:六款强大的开源数据挖掘工具

    在互联网发展到大数据时代,那么数据就等于金钱.随着向一个基于应用的领域过渡,数据则呈现出了指数级增长.然而,百分之八十的数据是非结构化的,因此它需要一个程序和方法来从中提取有用信息,并且将其转换为可理 ...

  2. 7款优秀的开源数据挖掘工具

    7款优秀的开源数据挖掘工具   IDMer说道:本文只对几种流行的开源数据挖掘平台进行了检视,比如Weka和R等.如果您想找寻更多的开源数据挖掘软件,可以到KDnuggets和Open Directo ...

  3. java 数据挖掘 开源_5个开源数据挖掘工具,收下这波干货

    数据挖掘是从大量数据中提取隐藏的或未知,但可能有用信息的过程.尤其在机器学习中,数据挖掘是十分重要的一环.今天给大家介绍5个开源数据挖掘工具,收下这波干货吧. 1. Orange Orange 是由C ...

  4. 几款优秀的开源数据挖掘工具

    几款优秀的开源数据挖掘工具 By kevinwu on December 28, 2008 2:39 AM | No Comments | No TrackBacks 本文只对几种流行的开源数据挖掘平 ...

  5. 开源数据挖掘工具Orange简介

    原文地址: http://cloga.info/python/2014/01/02/Orangeintro/#wat_e_19338566-a664-48dd-adf4-325f96bcec42 Or ...

  6. java weka 聚类_简单开源数据挖掘工具weka进行文本聚类

    目前非代码的数据挖掘工具很多,但非开源,weka是一款开源软件.只要安装jdk环境就可使用(具体安装jdk可以百度) 本文将论述如何不用代码,使用weka操作,通过与文档频数与单词权的特征选择方法进行 ...

  7. 几款开源的数据挖掘工具

    from: http://blog.csdn.net/u010140338/article/details/17454085 come from:http://idmer.blog.sohu.com/ ...

  8. 工具推荐 | 分析大数据最需要的Top 10数据挖掘工具

    点击查看全文 本文讲的是 工具推荐 | 分析大数据最需要的Top 10数据挖掘工具, 首先,我们要了解什么是数据挖掘?官方提供的定义如下:数据挖掘又称为资料探勘.数据采矿.它是数据库知识发现(Know ...

  9. 开始研究WEKA,一个开源java的数据挖掘工具

    开始研究WEKA,一个开源java的数据挖掘工具. HS沉寂这么多天,谁知道偏偏在我申请离职的时候给我安排了个任务,哎,无语. 于是,今天看了一天的Weka. 主要是看了HS提供的三个文章(E文,在g ...

  10. 最受欢迎的十大开源黑客工具推荐

    刚刚过去的一年,对于大多数信息安全从业人员来说是无话可说的一年,充斥各种狗血的开脑洞的剧情,可以出问题的地方全部都出了问题,从MongoDB数据库.到WiFi安全协议.英特尔处理器漏洞.到NSA的超级 ...

最新文章

  1. Python黑帽编程2.4 流程控制
  2. 真·降维打击:这篇SIGGRAPH 2020论文帮你「想象」三维生物眼里的四维空间
  3. OSPF路由聚合实验(详细)
  4. Spring AOP学习
  5. uniGUI试用笔记(十一)
  6. veket智能机器人
  7. 大学数学不好是一种什么体验?
  8. 数字图像处理(MATLAB)(第三版) 冈萨雷斯 中的matlab附录代码工具箱
  9. 小米计算机视觉算法工程师面试题
  10. Renascence架构介绍——文件夹
  11. spring-config.xml的annotation-driven详解
  12. linux博通网卡驱动怎么安装,ubuntu14.04手动安装博通官方无线网卡驱动时报错,...
  13. 259-数据明文传输的安全问题
  14. AMCL中odom的数据处理
  15. 苹果回忆:为证明 iPhone 结实,乔布斯拿起手机就往地上摔
  16. apple pay 技术_如何在Apple Watch上设置和使用Apple Pay
  17. 人工智能:确定性推理
  18. Docker学习(三):复杂软件安装-主从mysql及redis集群
  19. (三十)AO和GO剖析
  20. C语言求满足条件的xyz,c++编程,已知有式子:xyz+yzz=532, 其中x、y、z为数字,编写程序输出所有满足条件的x、y和z。...

热门文章

  1. 重回童年的经典系列 |《保卫萝卜》来了,你还记得它吗?复刻 源码+解析 @怀旧的你
  2. 迷你商城后端管理系统 ———— stage2 项目的核心代码实现
  3. P5960 【模板】差分约束算法 · spfa
  4. JavaScript就这么回事(好收藏,哪天忘了可以查一查)
  5. python上台阶问题_“上台阶问题”的分析
  6. 博客平台遭虚假勒索攻击、新黑客组织称对以色列的攻击负责|11月16日全球网络安全热点
  7. 疫情当前,企业数字化进程加速
  8. 五种“网络钓鱼”实例解析及防范技巧(转)
  9. Codeforces——C. Yet Another Walking Robot
  10. 微信公众平台测试号验证Token失败的坑