WEKA( OneR,过拟合)
OneR创建所谓的一层决策树,或者一组只检测某个属性的规则,一棵只在根节点根据某个属性值分叉的树,或者,一组只检测某个属性值的规则,一个属性一个分支。(也就是用一个属性来决策)
打开天气数据集
会发现是以outlook属性来划分
删除outlook属性再试一次
这次以湿度来划分
以上是用OneR默认设置划分的,点击设置分类
minBucketSize改为1
出现很多分叉,过拟合
打开diabetrs数据集
数字性数据集
选择ZeroR计算数据集的集线数据
OneR
minBucketSize决定模型的复杂度
做交叉验证,OneR准确率远高于基线准确率(基于plas)
改变为1
交叉验证准确率降低(基于pedi)
尝试用训练集
不能因为尝试了很多机器学习方法,就期望在新的数据集上取得相同效果,尝试很多,最终选择可能过拟合。使用交叉验证,得到的结果也不够,在这种情况下,把数据分为训练数据、测试数据和验证数据,使用训练和测试数据来选择机器学习方法,选择最适合训练的和测试的,或者使用交叉验证选择最适合训练数据的。选择好机器学习方法后,再使用验证数据来评估他针对的测试数据的真实效果。
WEKA( OneR,过拟合)相关推荐
- Weka OneR 和 ZeroR 加深理解
ZeroR分类器是一种最简单的分类器,这种方法仅仅根据历史数据统计规律,而选择一种概率最大的类别作为未知样本的分类结果,也就是说对于任意一个未知样本,分类结果都是一样的.ZeroR分类器简单的以多数类 ...
- 用 WEKA 进行数据挖掘,第 2 部分: 分类和群集
from:http://www.ibm.com/developerworks/cn/opensource/os-weka2/index.html 简介 在 用 WEKA 进行数据挖掘,第 1 部分:简 ...
- 开源机器学习:R Meets Weka zz
http://liouwei20051000285.blog.163.com/blog/static/2523674201052844649212/ 背景介绍: 1)Weka: Weka有两种意思: ...
- 机器学习之 weka学习(四)
本文转自: http://blog.csdn.net/lantian0802/article/details/8875874 http://blog.csdn.net/lkj345/article/d ...
- 机器学习之 weka学习(二)算法说明
本文转自:http://blog.csdn.net/mm_bit/article/details/47405433 weka中的各算法说明 1) 数据输入和输出 WOW():查看Weka函数的参数. ...
- weka中算法说明[转]
1) 数据输入和输出 WOW():查看Weka函数的参数. Weka_control():设置Weka函数的参数. read.arff():读Weka Attribute-Relation File ...
- 【转载】Weka入门教程
Source: http://forum.wekacn.org/viewtopic.php?f=2&t=9&sid=3e11f64d53cf134215bd69450412cdb9 1 ...
- Weka算法Classifier-meta-AdaBoostM1源代码分析(一)
多分类器组合算法简单的来讲经常使用的有voting,bagging和boosting,当中就效果来说Boosting略占优势,而AdaBoostM1算法又相当于Boosting算法的"经典款 ...
- Weka中数据挖掘与机器学习系列之Exploer界面(七)
不多说,直接上干货! Weka的Explorer(探索者)界面,是Weka的主要图形化用户界面,其全部功能都可通过菜单选择或表单填写进行访问.本博客将详细介绍Weka探索者界面的图形化用户界面.预处理 ...
最新文章
- 沃丰报告:物联网的未来
- java set 空_Java面试总结(Map和Set)
- APUE读书笔记-第14章-高级I/O
- hibernate教程--检索方式(hql,sql,QBC)
- Java Date Time 教程
- border-sizing属性详解和应用
- grep 显示包含两个关键字_linux三剑客之-grep
- java里的日期时间
- pythonfor循环语句例子_Python for循环学习总结
- POJ 3660 Cow Contest (闭包传递)
- 罗技g502鼠标使用感受,以及与g402的对比体验
- one-stage 目标检测——M2Det源码运行测试
- 经典软件架构设计模式
- 前端必知:微信小程序如何引入阿里图标
- Bezier曲线构造
- 机器人的自述作文_关于机器人的说明作文
- PIPIOJ1451: PIPI的数学题VIII
- python位运算用途_Python 位运算符与位运算
- NI无线通信与射频技术学习资源汇总
- 用“埃氏筛法”求2~10000以内的素数。2~100以内的数,先去掉2的倍数,再去掉3的倍数,再去掉5的倍数,……依此类推,最后剩下的就是素数。