OneR创建所谓的一层决策树,或者一组只检测某个属性的规则,一棵只在根节点根据某个属性值分叉的树,或者,一组只检测某个属性值的规则,一个属性一个分支。(也就是用一个属性来决策)

打开天气数据集

会发现是以outlook属性来划分

删除outlook属性再试一次

这次以湿度来划分

以上是用OneR默认设置划分的,点击设置分类

minBucketSize改为1

出现很多分叉,过拟合

打开diabetrs数据集

数字性数据集

选择ZeroR计算数据集的集线数据

OneR

minBucketSize决定模型的复杂度

做交叉验证,OneR准确率远高于基线准确率(基于plas)

改变为1

交叉验证准确率降低(基于pedi)

尝试用训练集

不能因为尝试了很多机器学习方法,就期望在新的数据集上取得相同效果,尝试很多,最终选择可能过拟合。使用交叉验证,得到的结果也不够,在这种情况下,把数据分为训练数据、测试数据和验证数据,使用训练和测试数据来选择机器学习方法,选择最适合训练的和测试的,或者使用交叉验证选择最适合训练数据的。选择好机器学习方法后,再使用验证数据来评估他针对的测试数据的真实效果。

WEKA( OneR,过拟合)相关推荐

  1. Weka OneR 和 ZeroR 加深理解

    ZeroR分类器是一种最简单的分类器,这种方法仅仅根据历史数据统计规律,而选择一种概率最大的类别作为未知样本的分类结果,也就是说对于任意一个未知样本,分类结果都是一样的.ZeroR分类器简单的以多数类 ...

  2. 用 WEKA 进行数据挖掘,第 2 部分: 分类和群集

    from:http://www.ibm.com/developerworks/cn/opensource/os-weka2/index.html 简介 在 用 WEKA 进行数据挖掘,第 1 部分:简 ...

  3. 开源机器学习:R Meets Weka zz

    http://liouwei20051000285.blog.163.com/blog/static/2523674201052844649212/ 背景介绍:  1)Weka: Weka有两种意思: ...

  4. 机器学习之 weka学习(四)

    本文转自: http://blog.csdn.net/lantian0802/article/details/8875874 http://blog.csdn.net/lkj345/article/d ...

  5. 机器学习之 weka学习(二)算法说明

    本文转自:http://blog.csdn.net/mm_bit/article/details/47405433 weka中的各算法说明 1) 数据输入和输出 WOW():查看Weka函数的参数. ...

  6. weka中算法说明[转]

    1) 数据输入和输出 WOW():查看Weka函数的参数. Weka_control():设置Weka函数的参数. read.arff():读Weka Attribute-Relation File ...

  7. 【转载】Weka入门教程

    Source: http://forum.wekacn.org/viewtopic.php?f=2&t=9&sid=3e11f64d53cf134215bd69450412cdb9 1 ...

  8. Weka算法Classifier-meta-AdaBoostM1源代码分析(一)

    多分类器组合算法简单的来讲经常使用的有voting,bagging和boosting,当中就效果来说Boosting略占优势,而AdaBoostM1算法又相当于Boosting算法的"经典款 ...

  9. Weka中数据挖掘与机器学习系列之Exploer界面(七)

    不多说,直接上干货! Weka的Explorer(探索者)界面,是Weka的主要图形化用户界面,其全部功能都可通过菜单选择或表单填写进行访问.本博客将详细介绍Weka探索者界面的图形化用户界面.预处理 ...

最新文章

  1. 沃丰报告:物联网的未来
  2. java set 空_Java面试总结(Map和Set)
  3. APUE读书笔记-第14章-高级I/O
  4. hibernate教程--检索方式(hql,sql,QBC)
  5. Java Date Time 教程
  6. border-sizing属性详解和应用
  7. grep 显示包含两个关键字_linux三剑客之-grep
  8. java里的日期时间
  9. pythonfor循环语句例子_Python for循环学习总结
  10. POJ 3660 Cow Contest (闭包传递)
  11. 罗技g502鼠标使用感受,以及与g402的对比体验
  12. one-stage 目标检测——M2Det源码运行测试
  13. 经典软件架构设计模式
  14. 前端必知:微信小程序如何引入阿里图标
  15. Bezier曲线构造
  16. 机器人的自述作文_关于机器人的说明作文
  17. PIPIOJ1451: PIPI的数学题VIII
  18. python位运算用途_Python 位运算符与位运算
  19. NI无线通信与射频技术学习资源汇总
  20. 用“埃氏筛法”求2~10000以内的素数。2~100以内的数,先去掉2的倍数,再去掉3的倍数,再去掉5的倍数,……依此类推,最后剩下的就是素数。

热门文章

  1. 平面设计中的插画设计技巧
  2. 促销 Eventide Clockworks 经典传奇效果器插件合集
  3. VisualNet地税管道资源管理系统
  4. 阿里云专网服务器连接互联网的设置
  5. 如何选择适合你的兴趣爱好(十五),油画
  6. 百度无线音乐盒刷打印服务器,百度无线音乐盒固件
  7. 关于Mac共享WiFi网络,看这里就够了(2 4G,5G , ipv6)
  8. Deepin重装Win10
  9. pdf文档里面如何删除其中一页
  10. 2016年计算机b级考试试题,2016年全国计算机等级考试模拟试题一级B.doc