西瓜书学习记录-决策树(第四章)

第四章啦

知乎黄耀鹏-决策树算法的Python实现:
https://zhuanlan.zhihu.com/p/20794583















一般分布例子如下:(见下具体例题)




以上例题详情可见西瓜书第4章:(截图如下,其中图和表均见上方截图)














代码示例:






简单说一下:根据gini指数来决定要不要继续往下分支








(预剪枝)第一次分:

第二次分:

精度从7分之5下降到了7分之4,所以剪枝,不要往下面再分了!!!对于预剪枝来讲,这个分支就到这儿了

对于稍凹这个分支来说,下面的分支的精度依然是7分之5,根据预剪枝来讲,也不再继续向下分支了
下面是后剪枝:(后剪枝就是保留所有的情况,然后从下往上开始减,如果往上精度提高则剪枝,如果往上精度不变则不剪)




缺失值处理例子:(见下图)
忽略缺失值的情况:











看的大佬的教学视频,标明一下出处:
https://www.bilibili.com/video/BV17J411C7zZ
记录一下,方便以后自己复习,加油!

西瓜书学习记录-决策树(第四章)相关推荐

  1. 西瓜书学习记录-神经网络(第五章)

    西瓜书学习记录-神经网络(第五章) 第五章啦,大佬的视频没讲第五章,所以看书自学一下: 书籍来自周志华的<机器学习>.

  2. 西瓜书学习记录-线性模型(第三章)

    西瓜书学习记录-线性模型(第三章) 第三章啦 反函数(上图) 梯度下降法: 补充:: 看的大佬的教学视频,标明一下出处: https://www.bilibili.com/video/BV17J411 ...

  3. 西瓜书学习记录-模型评估与选择(第二章)

    西瓜书学习记录-模型评估与选择 第二章啦 整个过程可以描述为在训练集上去训练,在验证集上去调参,调完参之后再到训练集上去训练,直到结果满意,最后到测试集上去测试. 例子(反例): 上图选择蓝色的线,坏 ...

  4. 西瓜书学习记录-绪论

    西瓜书学习记录-绪论 看了一下大神录的西瓜书读书记录,学习到很多东西,这里记录一下自己学习的一些截屏记录,方便以后再来复习,致敬大神们的讲解,感谢感谢. 看的大佬的教学视频,标明一下出处: https ...

  5. 西瓜书学习记录_绪言

    系列文章目录 文章目录 系列文章目录 前言 一.知识回顾 二.课后习题思考 1.3 总结 前言 该系列文章主要用于记录笔者在大三下学期的西瓜书学习过程 本文讨论西瓜书绪言中的学习体会以及对某些问题的思 ...

  6. 【数据科学系统学习】机器学习算法 # 西瓜书学习记录 [8] 支持向量机(二)...

    这两篇内容为西瓜书第 6 章支持向量机 6.1,6.2,6.4,6.3 的内容: 6.1 间隔与支持向量 6.2 对偶问题 6.4 软间隔与正则化 6.3 核函数 由于本章内容较多,分为两篇来叙述.本 ...

  7. 《西瓜书》阅读笔记——第四章

    <第四章>决策树 1. 基本流程 决策树(decision tree):从给定训练数据集学得一个模型用以对新示例进行分类. 决策树模型是基于树模型进行决策的,与人类在面临决策时的机制相似. ...

  8. 半导体材料 MOOC学习记录 第十四章 新型半导体材料SiC

    第十四章 新型半导体材料SiC 1 单选(1分) ‍以下对于SiC性质描述错误的是C ​ A. 硬度高,耐磨性好 B. 具有很高的电导率 C. 容易得到均匀.低缺陷密度的高纯晶体 D. 具有非常高的击 ...

  9. 【数据科学系统学习】机器学习算法 # 西瓜书学习记录 [12] 集成学习实践

    本篇内容为<机器学习实战>第 7 章利用 AdaBoost 元算法提高分类性能程序清单.所用代码为 python3. AdaBoost 优点:泛化错误率低,易编码,可以应用在大部分分类器上 ...

最新文章

  1. mysql 累计值_mysql 累计值计算
  2. 数据包过滤 系统 linux,Ubuntu16.04安装libpcap开发库对pcap文件中的数据包进行过滤...
  3. 关于zbar的libzbar.a不支持ipnone5的64bit问题
  4. Basic链表与队列的区别
  5. java09数组的使用
  6. 利用ptrace和memfd_create混淆程序名和参数
  7. cmake release和debug代码运行效果不一样_这35个小细节,让你的Java 代码运行效率翻倍!...
  8. 升级的Electric Cloud平台增添了大型机和微服务功能
  9. 个人作业week7——前端开发感想总结
  10. CefSharp中文帮助文档
  11. The overload Pattern
  12. Flask框架flash消息闪现学习与优化符合闪现之名#华为云·寻找黑马程序员#
  13. windowsPE系统的制作
  14. 文本处理技能与文本数据清洗、提取、分词与统计
  15. Scrum立会报告+燃尽图(十月二十六日总第十七次)
  16. 猫眼爬取专业评分的python技术
  17. 可持续时尚分论坛精彩回顾 | 第二届始祖数字化可持续发展峰会
  18. Java程序员怎么迈向架构师
  19. upupoo启动不了 mysql_显示桌面快捷方式
  20. Focal loss 和 GHM

热门文章

  1. 解题报告-Leecode 563. 二叉树的坡度——Leecode每日一题系列
  2. 剑指 Offer 27. 二叉树的镜像【无取巧解法,易于理解!】
  3. JAVA程序运行原理分析
  4. docker删除none镜像_Docker容器相关命令
  5. mixamo网站_超全面的素材网站推荐
  6. 事件驱动java实现_基于spring实现事件驱动
  7. shell脚本每日一练(二)
  8. hadoop 实战练习_Hadoop 实战实例
  9. STM32的GPIO为输出模式时获取其输出状态
  10. 十二星座用JAVA怎么,十二星座的“程序员”,都是怎么写代码的?