概念

  1. 决策树最顶端节点称为【根结点】,深度为0的决策树也称为【决策树桩】,不可再分的节点称为【叶节点】。
  2. sklearn支持的两个最常用的分割标准:a. criterion=‘gini’【基尼不纯度】; b. criterion=‘entropy’【信息增益】;
  • gini不纯度:是否错误分类?目标是最小化错误分类的概率,最优化分割gini不纯度为0
  • entropy信息增益: 不确定度多大?最完美分割信息熵为0

应用

  1. 持续增加深度,使得所有叶子都是纯的,有什么后果?
  • 表面这个决策树在训练集上正确率100%,但是测试集上可能表现很差,产生over-fitting
  1. 避免过拟合的两种常见方法
  • 预剪枝:尽早停止决策树生长,一般足够控制过拟合,但现实复杂场景就不足以控制,需用到多个决策树合并成的随机森林

    • max_depth:限制最大深度
    • max_leaf_nodes:限制最多的叶节点数量
    • min_simple_split:限制可分割最少样本数
  • 后剪枝:创建后移除或合并包含较少信息的节点

DataSets
Paper

决策树——学习笔记(一)相关推荐

  1. cart算法_决策树学习笔记(三):CART算法,决策树总结

    点击上方"Python数据科学",选择"星标公众号" 关键时刻,第一时间送达! 作者:xiaoyu 介绍:一个半路转行的数据挖掘工程师 推荐导读:本篇为树模型系 ...

  2. 机器学习之决策树学习笔记

    决策树 1.决策树的概念 决策树是什么? 决策树(decision tree)是一种基本的分类与回归方法,通俗的讲也就是一颗用于决策的树. 决策树长什么样呢? 举个通俗易懂的例子,如下图所示的流程图就 ...

  3. 第五章 决策树——学习笔记

    (一)决策树模型与学习 (二)特征选择  熵(entropy): H ( x ) = H ( p ) = − ∑ n j = 1 p i l o g p i H(x)=H(p)=- \underset ...

  4. 决策树学习笔记整理【转】

    本文目的 最近一段时间在Coursera上学习Data Analysis,里面有个assignment涉及到了决策树,所以参考了一些决策树方面的资料,现在将学习过程的笔记整理记录于此,作为备忘. 算法 ...

  5. 【西瓜书】第4章决策树---学习笔记

    1.基本流程 createBranch()函数的伪代码: 检测数据集中的每个子项是否属于同一分类: If so return 类标签: Else 寻找划分数据集的最好特征 划分数据集 创建分支节点 f ...

  6. 【基于CART的随机森林学习笔记】

    目录 算法描述 知识储备 举个栗子 实现代码 算法分析 资料引用 算法描述 1.随机森林是指一片森林的每棵树都表决,进而根据少数服从多数的原则决断出最后的结果.此篇以CART作为每一棵树的基本模型来说 ...

  7. 机器学习入门学习笔记:(3.2)ID3决策树程序实现

    前言 之前的博客中介绍了决策树算法的原理并进行了数学推导(机器学习入门学习笔记:(3.1)决策树算法).决策树的原理相对简单,决策树算法有:ID3,C4.5,CART等算法.接下来将对ID3决策树算法 ...

  8. 统计学习方法 学习笔记(十):决策树

    这一个学习笔记将要了解决策树,在研一上机器学习这门课的时候,老师在讲到这一节的时候,举了一个例子我现在还能记得:你们坐在这里上课,就像这个决策树一样,在你人生中的每一个重要结点,你都做出了选择,经过多 ...

  9. 机器学习理论《统计学习方法》学习笔记:第五章 决策树

    机器学习理论<统计学习方法>学习笔记:第五章 决策树 决策树 5.1 决策树模型与学习 5.1.1 决策树模型 5.1.2 决策树与if-then规则 5.1.3 决策树与条件概率分布 5 ...

最新文章

  1. wordcloud安装失败原因和解决方法
  2. springboot thymeleaf 生成静态html
  3. 【Spring】Spring学习笔记-01-入门级实例
  4. 【PAT乙级】1086 就不告诉你 (15 分)
  5. log4j配置文件及nutch中的日志配置
  6. 14.vue路由脚手架
  7. React Native与React的关系及特点
  8. python的装饰器很有用吗_你真的了解python装饰器么
  9. 数据库身份证号用什么类型_互联网企业数据库安全的现状与对策
  10. 市民卡怎么登录显示服务器繁忙,2分钟办理一笔业务 杭州网记者体验最具人气的“市民卡”窗口服务...
  11. eve-ng:加载c7200 dynamips镜像
  12. 正式学习Linux的第一节课
  13. 写教案时,PDF怎么转换成PPT?用迅读PDF大师,超简单
  14. libiconv库编译undefined reference to `aliases_lookup‘
  15. 阅读类APP开发的好处有哪些
  16. excel 第一讲:认识excel
  17. c语言撩妹小程序,撩妹简单的web小程序!分享给大家~~~~~~
  18. android平台获取手机IMSI,IMEI ,序列号,和 手机号的方法
  19. Angular8简单方式实现表格固定表头和冻结列
  20. Spectral matting

热门文章

  1. python 数据可视化 -- 读取数据
  2. python ---Pandas时间序列:生成指定范围的日期
  3. Python3 的内置函数和闭包
  4. 【Oracle】如何在查询视图时使用索引
  5. 重读The C programming Lanuage 笔记三:简单计算器程序
  6. 【ORACLE】oracl基本操作笔记
  7. 用Java模拟multipart形式的Http Post请求
  8. c#如何操作excel文件、Interior.ColorIndex 色彩列表
  9. 关于jQuery中的offset()和position()
  10. poj 3984 迷宫问题 BFS