文章目录

  • 0. 前言
  • 1. AdaBoost算法

如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔,我会非常开心的~

0. 前言

Boosting:先训练一个基学习器,然后根据学习器的表现对样本分布进行调整,给予做错的样本更多的关注,再基于调整后的分布训练下一个基学习器,如此重复达到指定的学习器数目,将这些学习器集成

Boosting主要关注降低偏差,因此能基于泛化性能弱的学习器构建出很强的集成。

AdaBoost是集成学习Boosting的代表算法。

1. AdaBoost算法

AdaBoost 算法流程可描述如下:

  1. 对每个训练样本设定相等的权重
  2. 训练一个加权错误率最低的最佳弱分类器,加权错误率为εt\varepsilon_tεt​
  3. 根据加权错误率,计算弱分类器的分类器权重αt=12ln⁡(1−εtεt)\alpha_t=\frac{1}{2}\ln(\frac{1-\varepsilon_t}{\varepsilon_t})αt​=21​ln(εt​1−εt​​)
  4. 更新权重向量,如果样本上一轮分类正确Dt+1(x)=Dt(x)exp⁡(−αt)∑i=1mDt(xi)D_{t+1}(x)=\frac{D_t(x)\exp(-\alpha_t)}{\sum_{i=1}^mD_t(x_i)}Dt+1​(x)=∑i=1m​Dt​(xi​)Dt​(x)exp(−αt​)​
  5. 更新权重向量,如果样本上一轮分类错误Dt+1(x)=Dt(x)exp⁡(αt)∑i=1mDt(xi)D_{t+1}(x)=\frac{D_t(x)\exp(\alpha_t)}{\sum_{i=1}^mD_t(x_i)}Dt+1​(x)=∑i=1m​Dt​(xi​)Dt​(x)exp(αt​)​
  6. 执行第2步,继续训练下一个弱分类器,直到弱分类器达到指定数量
  7. 预测时,将数据通过每个弱分类器,将其结果加权求和

如下图所示(图源:机器学习):

如果发现当前学习器不满足条件(分类错误率大于0.5,意味着不如随机选择),则抛弃这个学习器,并停止学习。


如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔,我会非常开心的~

西瓜书+实战+吴恩达机器学习(十二)监督学习之AdaBoost相关推荐

  1. 西瓜书+实战+吴恩达机器学习(二)机器学习基础(偏差、方差、调试模型技巧)

    文章目录 0. 前言 1. 偏差方差的解决方法 2. 高偏差高方差的学习曲线 3. 调试模型技巧 如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔,我会非常开心的~ 0. 前言 泛化误差可分解为 ...

  2. 西瓜书+实战+吴恩达机器学习(二十)随机算法(拉斯维加斯方法、蒙特卡罗方法)

    文章目录 0. 前言 1. 拉斯维加斯方法 2. 蒙特卡罗方法 如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔,我会非常开心的~ 0. 前言 随机算法主要分为两种类型: 拉斯维加斯方法:采样次 ...

  3. 西瓜书+实战+吴恩达机器学习(二二)概率图模型之马尔可夫随机场

    文章目录 0. 前言 1. 马尔可夫随机场结构 2. 近似推断 2.1. Metropolis-Hastings 如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔,我会非常开心的~ 0. 前言 ...

  4. 西瓜书+实战+吴恩达机器学习(二一)概率图模型之贝叶斯网络

    文章目录 0. 前言 1. 贝叶斯网络结构 2. 近似推断 2.1. 吉布斯采样 3. 隐马尔可夫模型HMM 如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔,我会非常开心的~ 0. 前言 概率 ...

  5. 西瓜书+实战+吴恩达机器学习(十五)无监督学习之关联分析(Apriori, FP-growth)

    文章目录 0. 前言 1. Apriori算法 1.1. 寻找频繁项集 1.2. 挖掘关联规则 2. FP-growth算法 2.1. 构建FP树 2.2. 寻找频繁项集 如果这篇文章对你有一点小小的 ...

  6. 西瓜书+实战+吴恩达机器学习(十四)无监督学习之聚类(k-means, LVQ, 高斯混合聚类, DBSCAN, AGNES)

    文章目录 0. 前言 1. 性能度量 1.1. 外部指标 1.2. 内部指标 2. 距离计算 3. k-means算法 4. 学习向量量化 5. 高斯混合聚类 6. 密度聚类 DBSCAN 7. 层次 ...

  7. 西瓜书+实战+吴恩达机器学习(十九)特征选择(过滤式选择、包裹式选择)

    文章目录 0. 前言 1. 过滤式选择 2. 包裹式选择 如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔,我会非常开心的~ 0. 前言 特征选择是一个很重要的数据预处理过程: 选择出重要的特征 ...

  8. 西瓜书+实战+吴恩达机器学习(十八)降维(主成分分析 PCA)

    文章目录 0. 前言 1. 主成分分析PCA 如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔,我会非常开心的~ 0. 前言 维数灾难:在高维情形下出现的数据样本稀疏.距离计算困难等问题. 缓解 ...

  9. 西瓜书+实战+吴恩达机器学习(十六)半监督学习(半监督SVM、半监督k-means、协同训练算法)

    文章目录 0. 前言 1. 半监督SVM 2. 半监督k-means 2.1. 约束k-means 2.2. 约束种子k-means 3. 协同训练算法 如果这篇文章对你有一点小小的帮助,请给个关注, ...

最新文章

  1. Ubuntu 安装软件的三种方式
  2. mfc 饼图绘画_绘画技能干货 | 【人体头颈】的绘画技巧(三)(内含母亲节抽奖公布)...
  3. python3的 pymysql把mysqldb库取代了,让python 3支持mysqldb的解决方法
  4. xxx is not mapped 错误 解决方案
  5. Windows xp 定时关机命令
  6. java8 追加文字到文件_使用Stream-Java 8替换文件中的文本
  7. c++ 获取当前时间_ThinkPHP6中获取参数的3种常用方法【总结】
  8. Webservice 实践
  9. 【ArcGIS|空间分析】图像纠正
  10. w8的计算机管理打不开,Win8.1系统打不开控制面板怎么办 win8.1无法打开控制面板如何解决...
  11. regexp(正则表达式)的使用
  12. 【存储】存储基本概念(lun,volume,HBA,DAS,NAS,SAN,iSCSI,IPSAN、存储池和存储卷)
  13. 神经元如何将视觉世界映射到人脑?
  14. netstat –ano|findstr “port”命令
  15. 接收Cookie总结
  16. 一生的读书计划——影响中国历史进程的中国名人
  17. 全力加速,绝对实力!从Q3财报看华米科技的逆势而为
  18. 信息学奥赛一本通1184 明明的随机数
  19. 如何进行质量管理(转载)
  20. 我听到过对初心最好的见解

热门文章

  1. 利用Python构建时间序列模型解决实际问题的正确姿势
  2. 梦断代码阅读笔记之二
  3. HTML5学习之视频与音频(三)
  4. Office Open XML学习(1)-创建excel文档,并向单元格中插入字符串
  5. 把.NET程序部署到没有安装.NET Framwork的机器上
  6. redis 分布式锁流程图
  7. liunx新装tomcat之后,tomcat不能识别新发布的项目
  8. java 输出helloword
  9. ARM汇编中ldr伪指令和ldr指令(转载)
  10. hdu 1518 dfs+剪枝