打开Weka后在弹出的Weka GUI Chooser 中点击 Explorer,进入探索者界面。探索者界面是Weka最简单的使用界面。所有的Weka功能都能在这个界面中通过点击鼠标和表单填写来使用。由于很多选项都预设了常用的默认值,使用户以最小的代价取得结果。不过该界面也有缺点:它会把样本数据全部读入内存,所以分析的样本数据量不能太大。

在探索者界面有6个标签,我们一个一个说:

预处理标签 Preprocess

预处理标签主要提供三个功能:样本数据的读入,样本过滤和样本的预览。
weka支持三种读入数据的方式:arff格式、csv格式还有文本格式。arff格式的支持最好,所以建议把其他两种格式都转成arff格式再读入,转换时要注意文件的编码,最好是utf8。转换语句:
java weka.core.converters.CSVLoader filename.csv > filename.arff
java weka.core.converters.TextDirectoryLoader -dir D:/temp/weka/TextDirectoryLoader/ > D:/temp/weka/data.arff

注意在文本转换的时候文件夹的名字表示类别,详见http://blog.csdn.net/chl033/article/details/4837232。

此外Weka还支持通过URL和数据库来读取样本,这里先按下不表。
预处理标签还有一个Filter功能来对样本的属性进行转换,对样本的实例进行操作。比如样本中有一个属性叫年龄为数值类型(1-150),可以用Discretize 过滤器进行离散,得到一个名词型的属性年龄段{少年,青年,中年,老年}。再比如实例过滤器中的NonSparseToSparse过滤器可以把样本实例转换成稀疏模式(购物篮分析中常用)。高端玩家还能自己编写过滤器。详见http://www.cnblogs.com/htynkn/archive/2012/04/02/weka_3.html 。
样本数据的概览以直观的图表展现了样本数据的类别和数量,不多说了。

分类器标签 Classify

Weka把大部分监督学习的算法都放在该标签中,包括了分类算法和回归算法。具体算法的选择在标签页最上面的下拉框中。
对于这个标签页我们着重讲讲 Test options。
监督学习的算法是指在已知样本类别的情况下生成分类器,然后用测试数据集调整分类器,提高准确度。在Test options(验证选项)中可以选择使用什么样的测试集。Use Training set 表示直接使用训练集做测试集。Supply test set表示使用另一个文件来做测试集。最下面还有一个Percentage Split 表示把训练集按百分比分割,一部分成为训练集一部分留作测试集。那么剩下的 cross validation(交叉验证) 是什么意思呢?
交叉验证带有一个参数选择,默认为10,俗称十折交叉验证。对于一个数据样本,它先把数据随机地分割成10份。然后将1份数据集当做测试集,9份数据当做样本集,进行学习。再选另一份数据集作测试集,其余的数据做样本集,依次类推,共进行10次。确保每次测试集都不同。最后将10个误差率估计值平均而得出一个综合误差估计。

聚类标签 Cluster

聚类标签页的设计跟分类标签页类似,但在验证选项中没有交叉验证,取而代之的是 Class to clusters evaluation 选项。它表示根据样本集中的某个属性来分类,并以之为依据校验聚类结果,在聚类时会自动忽略这个设定的属性。

转载于:https://www.cnblogs.com/rav009/p/5131128.html

Weka Explorer(探索者界面) 详解(1)相关推荐

  1. 圆形界面 开启相机_「基础篇三」手机摄影拍照界面详解

    ​[基础篇三]手机摄影拍照界面详解 手机拍照对我们来说已习以为常,每天我们都会用手机相机功能或多或少的拍出几张照片.故手机拍照界面对我们来说也不陌生,但手机拍照界面上的那些按钮,那些功能你都用过吗?你 ...

  2. 通过Cloudera Manager部署CDH5.15.1的webUI界面详解

    通过Cloudera Manager部署CDH5.15.1的webUI界面详解 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 本篇博客CDH的部署完全通过Cloudera Mana ...

  3. Symbian操作系统及操作平台界面详解

    Symbian操作系统及操作平台界面详解 作者:佚名 文章来源:本站原创 点击数: <script src="/Article/GetHits.asp?ArticleID=715&qu ...

  4. fifa15服务器维护,菜单界面详解:游戏设置界面_FIFA15系统教程图文攻略(完结)_FIFA15图文全攻略_单机攻略_跑跑车单机游戏网...

    第 4 页 菜单界面详解:游戏设置界面 游戏设置界面 赛事设置 赛事时长:选择3.4.5.6.7.8.9.10.15.20分钟作为比赛半场时间; 赛事难度:基于玩家的FIFA级数选择玩家的AI对手难度 ...

  5. ipriori weka java_weka apriori算法详解以及参数详解

    一.Apriori算法参数含义 本次共进行了9组实验,使用了weka安装目录data文件夹下的contact-lenses.arff数据. ToolsàArffViewer,打开contact-len ...

  6. solr管理界面详解

    原文地址:http://blog.csdn.net/zcl_love_wx/article/details/52092098 solr 服务器管理界面可以查看系统状态.solr设置.分词检测.查询索引 ...

  7. zipkin ui界面详解

    首页 首页里面主要承载了trace的查询功能,根据不同的条件,搜索出数据来 trace详情 span详情 这个图中,需要注意的是相对时间和调用行为 调用行为分如下四种: cs - Client Sen ...

  8. scratch界面详解

    大家好我是小杨,本章我们来详细的认识一下scratch3.0的界面,我们以scratch3.x离线版为例进行详细的介绍说明.scratch的界面主要分为了"标签栏""菜单 ...

  9. Xmanager远程连接Linux系统图形界面详解

    1.首先安装与下载图形界面GNOME yum groupinstall "Desktop" yum groupinstall "X Window System" ...

最新文章

  1. web进修之—Hibernate 继承映射(5)
  2. linux/Docker
  3. Struts2的类型转换(下)
  4. STM32下SysTick的一个容易发生的错误,时钟频率设置
  5. php+中午截取,PHP_php字符串截取中文截取2,单字节截取模式,//中文截取2,单字节截取模式 - phpStudy...
  6. mysql专门导入程序_从MySQL导入导出大量数据的程序实现方法
  7. 前端学习(2825):vs开发小程序的插件
  8. ipython和anaconda区别_anaconda和python区别
  9. Python接口自动化之cookie、session应用
  10. RabbitMQ-镜像队列配置相关
  11. struts2学习笔记(2)
  12. 美赛整理之Matlab读取全球海洋温度数据并显示干货
  13. C语言课设物业费管理系统(大作业)
  14. 在Idea中拉取svn分支
  15. 版本管理工具之ClearCase
  16. 牛气!青云QingCloud 进入“混合云市场竞争力领导者象限”
  17. 加仓减仓口诀_加仓减仓口诀
  18. Basic Blocks
  19. Java8新特性三:常用的函数式接口(Supplier,Consumer,Predicate,Function)
  20. module ‘eli5‘ has no attribute ‘show_weights‘

热门文章

  1. NEB方法计算离子扩散路径和能垒(过渡态的计算)
  2. SharkCDN,极速构建 CDN DNS 运营平台
  3. JavaAndroid调试方法
  4. 2016年1月28日github 出现大面积访问故障
  5. Spring获取上下文的四种方式方式
  6. 电大计算机试题及答案形成性,国开电大机械CAD/CAM形成性作业1答案
  7. flask url_for用法
  8. 基于java的企业门户网站系统设计
  9. stem教育小学制度管理
  10. 美国智能网联最新政策动态(2021年9-11月)