在众多分类算法中,决策树作为一种基于有监督学习的层次模型被大量使用,其有一种其他算法难以比拟的优点:可解释性强——通过将学习到的决策树可以很轻易的转换成“如果…那么”形式的规则。但决策树规则的建立依赖于树的生成,树的建立过程是对整个空间的递归划分、建立局部模型的过程,往往比较耗时,那么有没有方法可以跳过这一过程呢?答案就是规则归纳算法。不同于树归纳,其不需要建立搜索树而是采用深度优先搜索策略直接从数据集生成规则且每次生成一条,在构造规则的过程中利用了决策树的特点,通过诸如比较每个属性的信息增益不断贪心地添加规则前件,并且在每条规则的建立过程中使用后剪枝对规则进行裁剪,每条规则逐次生成然后加入到规则库中直到无法再添加更多规则。为了尽可能减少过拟合现象,在规则加入到规则库以后一样有剪枝步,这使得归纳算法有较好的过拟合现象。规则归纳算法的一个例子是RIPPER算法,其从一系列算法的基础上发展而来,与传统决策树算法如C4.5相比,其算法效率大大提升,而正确率相差不大。 先从一个很基础的规则算法REP说起,REP的意思是Reduced Error Pruning,意即减少错误剪枝,其把训练集分成独立的生长集和剪枝集,在生长集上贪心地产生规则并在剪枝集上不断被简化直到规则的准确性下降。作为一个很基础的算法其满足规则归纳的各个要件,描绘了RIPPER算法大体框架。然后是在REP算法上发展起来的IREP,其最主要的改变是使用了先剪枝与后剪枝结合的办法。接下来是IREP*算法,相比于IREP,其引入了最小描述长度用于判断停止条件,并且在剪枝时使用了新的度量标准1。而RIPPER算法则是在IREP*的基础上加入了优化阶段,其产生在IREP*产生的规则上进一步调整后的结果。 首先从最简单的二分类问题开始介绍RIPPER,先明确下若干概念:
<

RIPPER算法原理相关推荐

  1. CRF(条件随机场)与Viterbi(维特比)算法原理详解

    摘自:https://mp.weixin.qq.com/s/GXbFxlExDtjtQe-OPwfokA https://www.cnblogs.com/zhibei/p/9391014.html C ...

  2. 三维目标检测算法原理

    三维目标检测算法原理 输入输出接口 Input: (1)图像视频分辨率(整型int) (2)图像视频格式(RGB,YUV,MP4等) (3)左右两边的车道线位置信息摄像头标定参数(中心位置(x,y) ...

  3. 3D-2D:PnP算法原理

    3D-2D:PnP算法原理 1.问题背景-- 什么是PnP问题 ? 2.PnP问题的求解方法 2.1 P3P 2.1.1 算法的实际理解 2.1.2 算法的数学推导 2.1.3 算法的缺陷 2.2 直 ...

  4. MySQL索引背后的数据结构及算法原理【转】

    http://blog.codinglabs.org/articles/theory-of-mysql-index.html MySQL索引背后的数据结构及算法原理[转] 摘要 本文以MySQL数据库 ...

  5. 文本分类的基本思想和朴素贝叶斯算法原理

    文本分类的基本思想和朴素贝叶斯算法原理

  6. Bagging与随机森林算法原理小结

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 在集成学习原理小结中,我们讲到了集成学习有两个流派,一个是boos ...

  7. 干货 | 非常全面的谱聚类算法原理总结

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 谱聚类算法是目前最流行的聚类算法之一,其性能及适用场景优于传统的聚 ...

  8. 层次聚类算法原理总结

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 层次聚类(hierarchical clustering)基于簇间 ...

  9. 从传感器到算法原理,机器人、视觉避障尽在此文

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文转自:计算机视觉life 避障是指移动机器人在行走过程中,通过 ...

最新文章

  1. let const var 比较说明
  2. Powershell(3)
  3. stripes framework(框架)入门教程(附案例分析)
  4. Git 工作区恢复暂存区操作总览
  5. Android访问数据库(SQL Server 和 MySQL)
  6. moosefs-1.6.10 安装手记
  7. mac git 冲突工具
  8. 阅读笔记——《R数据可视化手册》肖楠等;主要ggplot2
  9. php 调用极光api,利用php+curl调用极光IM第三方REST API方法经验
  10. 问题:无法打开Workstation服务,错误代码2250
  11. 攻防世界-logmein-wp
  12. 李开复给中国学生的第二封信:从优秀到卓越
  13. Python合并有相同列的两个表格
  14. web高德地图路线规划(多条)
  15. PLC与运动控制器有什么不同?为什么运动控制器比PLC好?
  16. 第九篇:真正理解虚拟 DOM:React 选它,真的是为了性能吗?
  17. 进军数字货币新业务,500.com能否“涅槃”重生?
  18. Go实现简单的TCP服务端客户端通信(有黏包)
  19. 【转】WebRTC多人音视频解决方案
  20. 基于SSM婚恋网交友平台

热门文章

  1. h3c telnet
  2. 原来安全也能像足球那么踢的
  3. Window.Open- ShowModalDialog- Window.Open Session丢失的Solution
  4. EWSD命令输入格式解释
  5. 父类的析构函数定义为虚函数
  6. java推送技术_java网络编程 - java服务器推送技术系列方案实战
  7. leetcode 105. 从前序与中序遍历序列构造二叉树 c语言递归解法
  8. Linux信号 四 异步等待信号与同步等待信号接口
  9. Linux文件系统中文版,Linux 文件系统-Go语言中文社区
  10. mysql技术内幕innodb存储引擎——表索引算法和锁_(转)Mysql技术内幕InnoDB存储引擎-表索引算法和锁...