http://xiaogao39.blog.163.com/blog/static/7285602200910395121696/

Weka全名为怀卡托智能分析环境(WaikatoEnviron-meritforKnowledgeAnalysis),是一个基于java、用于数据挖掘和知识发现的开源项目,其开发者是来自新西兰怀卡托大学的IanH.Witten和EibeFrank。经过12年的发展历程,Weka是现今最完备的数据挖掘工具之一,而且被公认为是数据挖掘开源项目中最著名的一个,每月下载次数已超过万次。 和其他数据挖掘工具的艰深复杂不同,Weka使数据挖掘轻松易行,无需编程也能轻松实现:它提供了统一的用户界面,可在任何数据集上应用各种预处理和数据挖掘算法,同时还提供了数据可视化工具。介绍Weka的使用方法。  

运行Weka软件,有四种不同的界面供您选择:SimpleCLI、Explorer、Experimenter、KnowledgeFlow。 

     (1)SimpleCLI:能通过键入文本命令的方式来实现其他三个用户界面所提供的所有功能。  

(2)Explorer:是普通用户最常用的一个界面。用户可以从ARFF文件(Weka使用的一种文本文件格式)、网页或数据库中读取数据集。打开数据文件后,可以选择算法对数据进行预处理。这时窗体上给出了这个数据集的一些基本特征,如含有多少属性,各属性的一些简单统计量,右下方还给出一些可视化效果图。这些都是比较直观的分析,如果想发现隐藏在数据集背后的关系,还需要选择Weka提供的各种分类、聚类或关联规则的算法。所有设置完成后,点击Start按钮,就可以安心地等待weka带来最终的结果。哪些结果是真正有用的还要靠经验来判断。  

(3)Experimenter:这个界面可以同时使用多个算法对一组(或多组)数据进行分析,对各种算法分析的结果进行比较并从中选出最佳,还可以使用Experimenter把一项任务分割成多个子项,每个子项可以在单独的计算机上执行,从而大大加快了分析进程。  

(4)KnowledgeFlow:Explore的不足在于,当用户打开一个数据集时,所有数据将全部被读入到主存当中,随着任务规模的增大,普通配置的计算机很难满足要求。KnowledgeFlow提供了一个用于处理大型数据集的递增算法,专门处理这一问题。可以在KnowledgeFlow界面的工具条中拖动任意部件(代表数据源、预处理工具、数据挖掘算法、评估手段或可视化模块)放置在画布中,这些部件组合在一起形成一个数据流,当您选择有递增学习功能的过滤器和数据挖掘算法后,大型数据集就可以被分批读取和处理。   

  由于Weka的开源、易操作等优点,可供各类人群学习、使用。如果是一位数据挖掘算法的研究者,可以把自己的算法放在这个平台上,然后从海量数据中发掘其背后隐藏的种种关系。如果是数据挖掘的初学者,这是最好的学习平台,它不但简单易学,还提供了八个数据挖掘、统计学上的经典案例供您参考;如果在工作中有大量的数据需要分析,Weka也许能帮您发现更大的商机。  

注:Weka的最新版本是3.5:weka-3-5-3jre.exe(30.7M,带ire)和weka-3-5-3.exe(12.5M);  

应用平台:Windows、Linux和Macintosh操作系统;  

下载地址:http://www.cs.waikato.ac.nz/ml/weka。

数据挖掘工具weka使用相关推荐

  1. java weka 聚类_简单开源数据挖掘工具weka进行文本聚类

    目前非代码的数据挖掘工具很多,但非开源,weka是一款开源软件.只要安装jdk环境就可使用(具体安装jdk可以百度) 本文将论述如何不用代码,使用weka操作,通过与文档频数与单词权的特征选择方法进行 ...

  2. 开始研究WEKA,一个开源java的数据挖掘工具

    开始研究WEKA,一个开源java的数据挖掘工具. HS沉寂这么多天,谁知道偏偏在我申请离职的时候给我安排了个任务,哎,无语. 于是,今天看了一天的Weka. 主要是看了HS提供的三个文章(E文,在g ...

  3. 几款开源的数据挖掘工具

    from: http://blog.csdn.net/u010140338/article/details/17454085 come from:http://idmer.blog.sohu.com/ ...

  4. 7款优秀的开源数据挖掘工具

    7款优秀的开源数据挖掘工具   IDMer说道:本文只对几种流行的开源数据挖掘平台进行了检视,比如Weka和R等.如果您想找寻更多的开源数据挖掘软件,可以到KDnuggets和Open Directo ...

  5. java 数据挖掘 开源_5个开源数据挖掘工具,收下这波干货

    数据挖掘是从大量数据中提取隐藏的或未知,但可能有用信息的过程.尤其在机器学习中,数据挖掘是十分重要的一环.今天给大家介绍5个开源数据挖掘工具,收下这波干货吧. 1. Orange Orange 是由C ...

  6. python 数据挖掘工具_推荐19款最常用的数据挖掘工具

    数据在当今世界意味着金钱.随着向基于app的世界的过渡,数据呈指数增长.然而,大多数数据是非结构化的,因此需要一个过程和方法从数据中提取有用的信息,并将其转换为可理解的和可用的形式. 数据挖掘或&qu ...

  7. 工具推荐 | 分析大数据最需要的Top 10数据挖掘工具

    点击查看全文 本文讲的是 工具推荐 | 分析大数据最需要的Top 10数据挖掘工具, 首先,我们要了解什么是数据挖掘?官方提供的定义如下:数据挖掘又称为资料探勘.数据采矿.它是数据库知识发现(Know ...

  8. 推荐:几款优秀的数据挖掘工具

    [b]TipDM数据挖掘建模工具[/b] 一.产品简介: 顶尖数据挖掘平台(TipDM)是广州泰迪智能科技有限公司自主研发的一个数据挖掘工具,使用JAVA语言开发,能从各种数据源获取数据,建立各种不同 ...

  9. 几款优秀的开源数据挖掘工具

    几款优秀的开源数据挖掘工具 By kevinwu on December 28, 2008 2:39 AM | No Comments | No TrackBacks 本文只对几种流行的开源数据挖掘平 ...

最新文章

  1. 远程监控 – 数据采集管道
  2. class 与 原型链 解析
  3. mysql cmd常用命令
  4. 一个应届产品狗的产品日记【第二部:学做产品】
  5. wuhan2020新型冠状病毒防疫信息收集平台社区版非正式发布
  6. docker安装mysql远程不能访问,虚拟机中docker安装mysql远程无法访问解决方法
  7. JRuby:使Java和Ruby成为一家人
  8. 项目分享:通过使用SSH框架的公司-学员关系管理系统(CRM)
  9. Linux io内存存在的意义~
  10. TreeSet(不可重复,自动排序)实现自定义排序
  11. JSK-16500 金币【模拟】
  12. Java 网络编程(三) 创建和使用URL访问网络上的资源
  13. Android SDK环境变量配置-Windows10
  14. 网络操作系统发展历程
  15. R语言-上海二手房数据分析
  16. Super odometry:以IMU为核心的激光雷达视觉惯性融合框架(ICRA2021)
  17. 面向数据机密性的云计算脆弱性分析框架
  18. 电脑网络连接为什么常常连接不上
  19. 公众号数据全面分析解读(上篇)
  20. 如何利用阿里云服务器快照策略为数据备份

热门文章

  1. Metal之实现视频采集与实时渲染
  2. [WinError 127] 找不到指定的程序
  3. Linux操作系统中Anaconda的安装
  4. 超详细的HTTP面试题
  5. Curses 中的 noecho() 函数
  6. python人工智能——深度学习——TensorFlow基本介绍
  7. 大数据WEB阶段(十八)数据库事务
  8. 【C++】C/C++系列教程汇总(更新中......)
  9. 【STM32】定时器相关函数和类型
  10. 【IT资讯】继哈工大Matlab软件被美禁用后,华为、360再遭Docker软件禁令