决策树分类

1,概念

    

    

2,决策树算法

2.1,特征选择:

  熵:值越大,不确定性因素越大;条件熵:条件对结果的影响不确定性;信息增益;信息增益比

    

            

       

2.2,决策树生成算法

  1,ID3算法

  

  

  2,c4.5算法

  

3,实例说明

  

  

4,CART决策树算法

4.1 决策树生成

  回归树生成

             

  分类树生成

          

   举个例子:

    

    第一种划分方法:{“学生”}、{“老师”、“上班族”} 来预测婚姻

        

    第二种划分方法:{“老师”}、{“学生”、“上班族”}

    第三种划分方法:{“上班族”}、{“学生”、“老师”}

4.2,决策树剪枝

  

    例如:图1中ti表示决策树中第i个节点,A、B表示训练集中的两个类别,A、B之后的数据表示落入该节点分别属于A类、B类的样本个数。

        

   

5,决策树算法比较

    

6,总结

  个人认为算法通过使用训练集构建一个决策树后,获得一系列的规则,输入测试集后,按照规则获取到叶节点,然后根据叶节点最大占有比的那个类为该测试集所属的类,从而达到分类效果

参考网址:

  1,cart例子

  2,剪枝例子

  3,决策树比较

统计学习方法五 决策树分类相关推荐

  1. 【统计学习方法】决策树

    何为决策树? 决策树定义 决策树是一种用于分类的树结构.如图所示,它由结点(node)和有向边(directed edge)组成,结点包括内部结点(internal node)和叶结点(leaf no ...

  2. matlab决策树模型过程,利用MATLAB统计工具箱进行决策树分类的一个例子

    这个例子开始从lda线性分类算法,最后引出决策树分类算法,不错,初学者可以参考下 网上的很多决策树算法都没有例子,都是就一堆代码都不知道参数怎么传递.直接用工具箱里面的决策树算法,不懂得就help一下 ...

  3. 统计学习方法之决策树(2)信息增益比,决策树的生成算法

    声明:原创内容,如需转载请注明出处 今天讲解的内容是: 信息增益比,决策树的生成算法-ID3和C4.5 我们昨天已经学习了什么是信息增益,并且通过信息增益来选择最优特征,但是用信息增益会出现偏向于选择 ...

  4. 文本分类入门(三)统计学习方法

    文本分类入门(三)统计学习方法 前文说到使用统计学习方法进行文本分类就是让计算机自己来观察由人提供的训练文档集,自己总结出用于判别文档类别的规则和依据.理想的结果当然是让计算机在理解文章内容的基础上进 ...

  5. 【菜菜的sklearn课堂笔记】决策树-分类树

    视频作者:菜菜TsaiTsai 链接:[技术干货]菜菜的机器学习sklearn[全85集]Python进阶_哔哩哔哩_bilibili 关键概念:节点 根节点:没有进边,有出边.包含最初的,针对特征的 ...

  6. 统计学习方法---李航

    统计学习方法笔记 第一章:统计学习概论 1.1 统计学习 统计学习( statistical learning)是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科.统计学习也 ...

  7. 复现经典:《统计学习方法》第 8 章 提升方法

    本文是李航老师的<统计学习方法>[1]一书的代码复现. 作者:黄海广[2] 备注:代码都可以在github[3]中下载. 我将陆续将代码发布在公众号"机器学习初学者", ...

  8. 09_期望极大法EM1_统计学习方法

    文章目录 一.EM算法的引入 1.极大似然估计 2.EM入场 二.EM算法推导 1.Jensen不等式 2.EM推导过程 (1)统计学习方法EM推导 (2)Andrew NG关于EM算法的推导 3.统 ...

  9. 07_支持向量机1_统计学习方法

    文章目录 一.支持向量机的介绍 二.支持向量机模型 1.何为分类间隔 (1)函数间隔 (2)几何间隔 2.分类间隔最大化 3.支持向量机中涉及的数学知识 (1)凸函数 (2)常见最优化问题 (3)拉格 ...

最新文章

  1. codefores 786B. Legacy(最短路,线段树优化拆点,好题)
  2. jquery 的3D Carousel插件参数说明
  3. 2.16 关于 Python Numpy 的说明-深度学习-Stanford吴恩达教授
  4. unity 给图片边缘_Unity Shader 屏幕后效果——边缘检测
  5. 终于不用手撸了,解放你的双手,教你用数学建模的方式对答题卡进行有效识别
  6. 验证手机号码的正则表达式
  7. PHP-代码审计-文件读取(下载)
  8. 机器学习数据集哪里找:最佳数据集来源盘点
  9. Dubbo 框架设计与源码解读(配置解析优先级、线程分配、负载均衡、容错方案)
  10. c语言某年某月的天数switch,在C语言中 使用switch语句编写“显示某年某月的天数”程序:...
  11. 5 多数据save_5个高质量行业数据报告资源下载地方,自己想一下有多重要吧
  12. 外边距的典型应用-让块级盒子水平居中(HTML、CSS)
  13. win10+Xming+Xshell显示远程linux服务器的图形程序窗口
  14. 分享自己喜欢的无损高音质音乐给大家
  15. 有备无患:避免文件丢失的可行方案
  16. 什么是MTU?为什么MTU值普遍都是1500?
  17. GMM估计分析步骤及结果解读
  18. 杭州电子科技大学acm--2021
  19. 人工智能 感情 自我意识
  20. CSSCSS3基础教程

热门文章

  1. 保持稳定情绪:工作中的情绪管理之道
  2. “生活”才是生活的一部分
  3. IDEA 修改字体大小
  4. ELK日志中心集群,看完工资+1k
  5. CGAL中2D三角剖分
  6. 带头节点反转链表的几种方式(附带gif流程图)
  7. 与外国同事实现专业与和谐的共处
  8. 郝斌老师C语言学习笔记(一)
  9. 边缘计算的技术趋势与挑战
  10. jvm理解以及面试题