目录

主要内容

决策树

信息增益

三种决策树学习算法

决策树的例子

决策树的过拟合

Bootstraping

Bagging的策略

随机森林

提升的概念

Adaboost

举例


主要内容

决策树

 决策树学习采用的是自顶向下的递归方法,
 其基本思想是以信息熵为度量构造一棵熵值下降最快的树,到叶子节点处的熵值为零,
 此时每个叶节点中的实例都属于同一类。
 有监督学习

 建立决策树的关键,即在当前状态下选择哪个属性作为分类依据。根据不同的目标函数,建立决策树主要有一下三种算法。
 ID3
 C4.5
 CART

信息增益

三种决策树学习算法

决策树的例子

决策树的过拟合

 决策树对训练属于有很好的分类能力,但对未知的测试数据未必有好的分类能力,泛化能力弱,即可能发生过拟合现象。
 剪枝
 随机森林

Bootstraping

 Bootstraping的名称来自成语“pull up by yourown bootstraps”,意思是依靠你自己的资源,称为自助法,它是一种有放回的抽样方法。
 注: Bootstrap本义是指高靴子口后面的悬挂物、小环、带子,是穿靴子时用手向上拉的工具。“pullup by your own bootstraps”即“通过拉靴子让自己上升”,意思是“不可能发生的事情”。后来意思发生了转变,隐喻“不需要外界帮助,仅依靠自身力
量让自己变得更好” 。

Bagging的策略

每一个样本能生成一个决策树,最后投票

bagging不仅适合于决策树,也适合于其它算法

类似于民主政治

adaboost精英政治,加权平均

随机森林

随机,1 样本有放回抽样

2是属性的选择

提升的概念

Adaboost

举例

七月算法机器学习 11 决策树、随机森林、 adaboost相关推荐

  1. 机器学习实战之分类算法(K-近邻/朴素贝叶斯/决策树/随机森林)

    机器学习分类算法 1. 机器学习算法简介 1.1 按照学习方式分类 1.2 区别 1.3 关于监督学习中的分类与回归区别 1.4 机器学习开发流程 2. 数据集介绍与划分 2.1 sklearn数据集 ...

  2. 随机森林分类算法python代码_Python机器学习笔记:随机森林算法

    随机森林算法的理论知识 随机森林是一种有监督学习算法,是以决策树为基学习器的集成学习算法.随机森林非常简单,易于实现,计算开销也很小,但是它在分类和回归上表现出非常惊人的性能,因此,随机森林被誉为&q ...

  3. 机器学习算法(6)——随机森林

    随机森林(Random Forests) 随机森林是一种重要的基于Bagging的集成学习方法,可以用来做分类.回归等问题.要学随机森林,先简单介绍一下集成学习方法和决策树算法. Bagging和Bo ...

  4. python 随机森林调参_Python机器学习实践:随机森林算法训练及调参-附代码

    原标题:Python机器学习实践:随机森林算法训练及调参-附代码 文章发布于公号[数智物语] (ID:decision_engine),关注公号不错过每一篇干货. 来源 | 博客园 作者 | 战争热诚 ...

  5. 机器学习——决策树+随机森林

    目录 决策树 认识决策树 决策树的生成 信息的单位--比特 信息熵 决策树的划分依据之一--信息增益 例题--银行贷款分析 决策树的其他分类依据 案例--泰坦尼克号乘客生存分类 决策树的结构.本地保存 ...

  6. 【机器学习】P25 随机森林算法(2) 实现 “波士顿房价” 预测

    随机森林算法 Random Forest Algorithm 随机森林算法 随机森林算法实现波士顿房价预测 随机森林算法 随机森林(Random Forest)算法 是一种 集成学习(Ensemble ...

  7. 机器学习-Sklearn-02(随机森林)

    机器学习-Sklearn-02(随机森林) 学习2 随机森林在sklearn中的实现 1 概述 1.1 集成算法概述 集成学习(ensemble learning)是时下非常流行的机器学习算法,它本身 ...

  8. 机器学习二【随机森林】

    随机森林 1. 概述 1.1 集成算法概述 1.2 sklearn中的集成算法 2 .RandomForestClassifier 2.1 重要参数 2.1.1 控制基评估器的参数 2.1.2 n_e ...

  9. HuaPu在学:机器学习——sklearn【随机森林】

    随机森林 文章目录 随机森林 一.集成算法 二.RandomForestClassifier [控制基评估器的参数] [n_estimators] [random_state] [bootstrap ...

  10. 随机森林分类算法python代码_随机森林的原理及Python代码实现

    原标题:随机森林的原理及Python代码实现 最近在做kaggle的时候,发现随机森林这个算法在分类问题上效果十分的好,大多数情况下效果远要比svm,log回归,knn等算法效果好.因此想琢磨琢磨这个 ...

最新文章

  1. 深入解析Java编译器学习笔记
  2. Winform中实现自定义屏保效果(附代码下载)
  3. Java黑皮书课后题第9章:9.8(Fan类)设计一个名为Fan的类来代表风扇
  4. vcenter 6.7 (vcsa)部署指南
  5. 如何把很多照片拼成一张照片_一张现场照片引发的中韩之争
  6. 我的内核学习笔记16:海思Hi3516平台PWM使用记录
  7. unity2D人物和物体的碰撞设置
  8. 传智播客Lucene视频教程
  9. 51-表达式计算(带括号的)
  10. linux 上自动执行caffe,linux下caffe的命令运行脚本
  11. MATLAB 程序出现错误总结
  12. 华中科技大学2005年计算机组成原理试题,华中科技大学2005年计算机组成原理试题...
  13. spss无法连接到本地计算机,通过远程连接打开SPSS产品时,收到许可证错误信息。从本地打开同一产品时没有错误。...
  14. EasyCHM - 电子书制作软件
  15. Photoshop DPI缩放比例问题
  16. docker用现有容器创建镜像
  17. 红外小目标检测中ROC曲线的绘制
  18. 计算机视觉 常用坐标系一览
  19. /dev/tty、/dev/ttyS/、/dev/ttyUSB区别
  20. 【华为OD机试模拟题】用 C++ 实现 - 英文输入法单词联想 or 英文输入法(2023.Q1)

热门文章

  1. 知识都是公开的,程序员水平相差巨大的因素有哪些
  2. 如何正确获取安卓外置SD卡的路径
  3. VS错误的解决解决:LINK fatal error LNK1000: Internal error during IncrBuildImage
  4. linux卸载rpm安装的golang,linux下go安装/卸载重装-Go语言中文社区
  5. c++ 类与默认函数、包括构造函数和析构函数的特点
  6. python 移动平均线_如何使用NumPy计算移动平均线?
  7. php mysql修改表单数据_表单修改数据
  8. python查看数据大小_python 监控文件大小
  9. java同步器有哪些_Java 队列同步器 AQS
  10. HttpClient 使用指南 - POST篇