决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。Entropy = 系统的凌乱程度,使用算法ID3, C4.5和C5.0生成树算法使用熵。这一度量是基于信息学理论中熵的概念。

决策树是一种树形结构,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类别。

分类树(决策树)是一种十分常用的分类方法。他是一种监管学习,所谓监管学习就是给定一堆样本,每个样本都有一组属性和一个类别,这些类别是事先确定的,那么通过学习得到一个分类器,这个分类器能够对新出现的对象给出正确的分类。这样的机器学习就被称之为监督学习。

组成

决策树的剪枝

剪枝是决策树停止分支的方法之一,剪枝有分预先剪枝和后剪枝两种。预先剪枝是在树的生长过程中设定一个指标,当达到该指标时就停止生长,这样做容易产生“视界局限”,就是一旦停止分支,使得节点N成为叶节点,就断绝了其后继节点进行“好”的分支操作的任何可能性。不严格的说这些已停止的分支会误导学习算法,导致产生的树不纯度降差最大的地方过分靠近根节点。后剪枝中树首先要充分生长,直到叶节点都有最小的不纯度值为止,因而可以克服“视界局限”。然后对所有相邻的成对叶节点考虑是否消去它们,如果消去能引起令人满意的不纯度增长,那么执行消去,并令它们的公共父节点成为新的叶节点。这种“合并”叶节点的做法和节点分支的过程恰好相反,经过剪枝后叶节点常常会分布在很宽的层次上,树也变得非平衡。后剪枝技术的优点是克服了“视界局限”效应,而且无需保留部分样本用于交叉验证,所以可以充分利用全部训练集的信息。但后剪枝的计算量代价比预剪枝方法大得多,特别是在大样本集中,不过对于小样本的情况,后剪枝方法还是优于预剪枝方法的。

参考资料

以上内容来自百度百科

Decision Tree(DT)决策树相关推荐

  1. 决策树(Decision Tree) | 绘制决策树

    01 起 在这篇文章中,我们讲解了如何训练决策树,然后我们得到了一个字典嵌套格式的决策树结果,这个结果不太直观,不能一眼看着这颗"树"的形状.分支.属性值等,怎么办呢? 本文就上文 ...

  2. Machine Learning | (7) Scikit-learn的分类器算法-决策树(Decision Tree)

    Machine Learning | 机器学习简介 Machine Learning | (1) Scikit-learn与特征工程 Machine Learning | (2) sklearn数据集 ...

  3. GBDT(Gradient Boosting Decision Tree

     GBDT(Gradient Boosting Decision Tree) 又叫 MART(Multiple Additive Regression Tree),是一种迭代的决策树算法,该算法由 ...

  4. dt决策树_决策树:构建DT的分步方法

    dt决策树 介绍 (Introduction) Decision Trees (DTs) are a non-parametric supervised learning method used fo ...

  5. Decision Tree

    #①Aggregation Model 回顾上一篇文章讲到的聚合模型,三个臭皮匠顶一个诸葛亮.于是出现了blending,bagging,boost,stacking.blending有uniform ...

  6. 机器学习技法总结(六)Decision Tree Hypothesis

    这里先再次提出我们利用aggregation获取更好性能的Hypothesis G所涉及的方法:blending,就是在得到g_set之后进行融合:learning呢?就是在线online的获取g并融 ...

  7. 『机器学习』 —— 决策树算法(Decision Tree)

    文章首发地址见个人博客 决策树(Decision Tree) 1.机器学习算法中分类和预测算法的评估 准确率 速度 强壮性 可规模性 可解释性 2.什么是决策树(Decision Tree)? 决策树 ...

  8. 决策树(Decision Tree,DT)

    文章目录 1. 决策树模型与学习 2. 特征选择 2.1 特征选择Python代码 3. 决策树的生成 3.1 Python代码 4. 决策树的剪枝 5. CART 算法 6. sklearn 例子 ...

  9. 机器学习面试题——决策树DT(Decision Tree),二叉树或多叉树分支决策分类

    机器学习面试题--决策树DT(Decision Tree),二叉树或多叉树分支决策分类 提示: 决策树算法起源于E.B.Hunt等人于1966年发表的论文"experiments in In ...

最新文章

  1. 继承WebMvcConfigurer 和 WebMvcConfigurerAdapter类依然CORS报错? springboot 两种方式稳定解决跨域问题
  2. Haproxy Nginx cluster构建
  3. python求平方根的代码_Python求平方根(附带源码)
  4. DelegateModel QML类型
  5. 套接口学习(一)实现
  6. Extjs4:改变Grid单元格背景色(转载)
  7. 用户访问共享计算机没有权限,win7共享没有权限访问 共享文件访问权限的方法...
  8. C#_XXX事件 的重载均与委托System.EventHandler不匹配
  9. linux查看系统后台,求助,如何查看后台服务
  10. html 网络请求 json数据,写一个json格式API,http请求接收json数据
  11. C#获取 Flv视频文件播放时间长度等信息
  12. springboot 调用Jxbrowser内嵌浏览器
  13. 移动加权平均全月平均
  14. Typora设置图片的题注(标题)
  15. MAC 访问 Windows 共享文件夹
  16. springboot+vue基本微信小程序的疫情防控平台系统 计算机毕业设计
  17. 代驾APP小程序源码交付 所需功能大全
  18. Historian 7.0 安装说明
  19. 工程师评测 | RK3568开发板上手测试
  20. 国内外开源商城系统盘点

热门文章

  1. v-if和v-for一起用踩过的坑
  2. 常见的浏览器兼容性问题大汇总
  3. VS2013 异常处理
  4. linux 同一个ip 绑定两个不同的域名 访问两个不同的项目
  5. OpenCV kmeans代码
  6. Cannot get a connection, pool error Timeout waiting for idle object (获取不到数据库连接)...
  7. GridView的操作:导出Excel[方案一]
  8. HTML中的表格和表单控件详解
  9. linux下解压 编译 安装,Linux 下开发环境安装配置-编译、解压、超链、
  10. java使用hashset_Java集合(二)HashSet的使用