分类树与回归树

分类树用于分类问题。分类决策树在选取划分点,用信息熵、信息增益、或者信息增益率、或者基尼系数为标准。
Classification tree analysis is when the predicted outcome is the class to which the data belongs.

回归决策树用于处理输出为连续型的数据。回归决策树在选取划分点,就希望划分的两个分支的误差越小越好。

Regression tree analysis is when the predicted outcome can be considered a real number (e.g. the price of a house, or a patient’s length of stay in a hospital)。

回归树

英文名字:Regression Tree

原理介绍

回归树总体流程也是类似,区别在于,回归树的每个节点(不一定是叶子节点)都会得一个预测值,以年龄为例,该预测值等于属于这个节点的所有人年龄的平均值。分枝时穷举每一个feature的每个阈值找最好的分割点,但衡量最好的标准不再是最大熵,而是最小化均方差即(每个人的年龄-预测年龄)^2 的总和 / N。也就是被预测出错的人数越多,错的越离谱,均方差就越大,通过最小化均方差能够找到最可靠的分枝依据。分枝直到每个叶子节点上人的年龄都唯一或者达到预设的终止条件(如叶子个数上限),若最终叶子节点上人的年龄不唯一,则以该节点上所有人的平均年龄做为该叶子节点的预测年龄。
总结:回归树使用最大均方差划分节点;每个节点样本的均值作为测试样本的回归预测值[1]。

节点的预测值是该节点下所有点的均值,这点在李航老师的《统计及旗下学习》中有体现:

code:

输出结果:

决策树优缺点

优点:

(1)速度快: 计算量相对较小, 且容易转化成分类规则. 只要沿着树根向下一直走到叶, 沿途的分裂条件就能够唯一确定一条分类的谓词.
(2)准确性高: 挖掘出来的分类规则准确性高, 便于理解, 决策树可以清晰的显示哪些字段比较重要, 即可以生成可以理解的规则.
(3)可以处理连续和种类字段
(4)不需要任何领域知识和参数假设
(5)适合高维数据

缺点:

(1)对于各类别样本数量不一致的数据, 信息增益偏向于那些更多数值的特征
(2)容易过拟合
(3)忽略属性之间的相关性

机器学习-----回归树相关推荐

  1. 【机器学习】树回归和聚类算法解析和应用

    [机器学习]树回归和聚类算法解析和应用 文章目录 1 树回归 2 CART ( Classification And Regression Tree) 分类回归树 3 K-means3.1 合理选择 ...

  2. 机器学习系列之手把手教你实现一个分类回归树

    https://www.ibm.com/developerworks/cn/analytics/library/machine-learning-hands-on5-cart-tree/index.h ...

  3. 【机器学习基础】深入理解Logistic Loss与回归树

    Logistic Function Logistic Function最常见的定义形式如下: 其中,,实际上这个公式起源于伯努利分布,代表概率,关于其起源在此暂不赘述. 公式有一个重要的性质,即: 并 ...

  4. id3决策树 鸢尾花 python_机器学习之分类回归树(python实现CART)

    机器学习之分类回归树(python实现CART) 之前有文章介绍过决策树(ID3).简单回顾一下:ID3每次选取最佳特征来分割数据,这个最佳特征的判断原则是通过信息增益来实现的.按照某种特征切分数据后 ...

  5. 机器学习实战(八)分类回归树CART(Classification And Regression Tree)

    目录 0. 前言 1. 回归树 2. 模型树 3. 剪枝(pruning) 3.1. 预剪枝 3.2. 后剪枝 4. 实战案例 4.1. 回归树 4.2. 模型树 学习完机器学习实战的分类回归树,简单 ...

  6. 机器学习——07树回归

    机器学习--07树回归 参考资料 AIlearning Machine-Learning-in-Action 机器学习实战(美)哈林顿(Harrington,P.)著:李锐等译.-北京:人民邮电出版社 ...

  7. 机器学习-有监督学习-分类算法:决策树算法【CART树:分类树(基于信息熵;分类依据:信息增益、信息增益率、基尼系数)、回归树(基于均方误差)】【损失函数:叶节点信息熵和】【对特征具有很好的分析能力】

    一.决策树概述 注:生产实践中,不使用决策树,太简单,而是使用决策树的升级版:集成学习算法. 集成学习算法有: Random Forest(随机森林) Extremely Randomized For ...

  8. 机器学习之分类回归树(CART)

    前言 写这一章本来是想来介绍GBDT-LR这一个推荐模型的.但是这里面就涉及到了很多机器学习的基础树形算法,思前想后还是决定分成几篇文章来写,这里先介绍一下CART数,因为在GBDT中用来分类回归的树 ...

  9. 机器学习 | 决策树之回归树

    机器学习 | 决策树之回归树 上文提到决策树不仅可用于分类,还可进行回归,本文将继续记录回归决策树. 文章目录 机器学习 | 决策树之回归树 前言 一.回归树的构建方法 二.递归二分法 三.回归树的剪 ...

最新文章

  1. Hibernate学习(九)———— 二级缓存和事务级别详讲
  2. 最近对Allegro的几个总结
  3. 值得推荐的Idea十二大优秀插件
  4. 使用data uri将图片内嵌到html中
  5. 详细解析ASP.NET中Request接收参数乱码原理
  6. 网站“注册流程”如何“照顾用户”?
  7. Eclipse c++ 中[Linker error] undefined reference to `WSAStartup@8'的解决办法
  8. hazelcast入门教程_Hazelcast入门指南第6部分
  9. cogs1799 [国家集训队2012]tree(伍一鸣)
  10. 今晚8点直播(内含福利)丨 Oracle RAC集群安装部署
  11. Ubuntu下安装支付宝安全控件
  12. QuickTest Professionar 快捷键
  13. HDU1013 Digital Roots
  14. 有监督学习、无监督学习、半监督学习和强化学习的总结
  15. 【测试Demo】JavaAPI操作阿里云对象存储(OSS)
  16. KECRS: Towards Knowledge-Enriched Conversational Recommendation System
  17. vue+vantUI模板
  18. 前端第二章:1.HTML简介、Linux 命令行打开 .html 文件、常用标签(一)
  19. Call From xx/x.x.x.x .hdp1:9000:java.net.ConnectException:拒绝连接For m...see:http://wiki.apac..Refused
  20. java编写图书管理系统

热门文章

  1. JAVA学习笔记——JVM、JDK和JRE(包含JDK的下载与安装)
  2. 什么是边框回归Bounding-Box regression,以及为什么要做、怎么做
  3. 安全档案 | 具体包括那些内容01
  4. 20210317_23期_集成学习(上)_Task02_sklearn构建完整机器学习模型
  5. 崩坏三服务器对游戏有影响吗,崩坏3:新人应该如何选择适合自的服务器?但是ios千万别碰...
  6. 抖音“心动”外卖,美团社交“未艾”
  7. 佳能ir1133硒鼓替换方案
  8. CAD转PDF转换教程合集!CAD格式转换方法大全,简单一步操作哦
  9. css鼠标经过div1时div2消失,CSS_两个div叠加触发事件发生闪烁问题的解决方法,当鼠标移到div1上的时候,会出 - phpStudy...
  10. android自动夜间模式,Android 夜间模式初探