A (small) introduction to Boosting
https://codesachin.wordpress.com/tag/adaboost/

这里翻译了一下这篇博客,对 boosting 介绍的很好

What is Boosting? 什么是 Boosting
Boosting is a machine learning meta-algorithm that aims to iteratively build an ensemble of weak learners, in an attempt to generate a strong overall model.
下面分别对上面的定义进行逐词解析
1)weak learners 弱学习器
A ‘weak learner’ is any ML algorithm (for regression/classification) that provides an accuracy slightly better than random guessing.
就是比随机猜测好一点的一个机器学习算法。随机猜测的准确率是 50%,所以任何一个算法其准确率超过50% 都是一个弱学习器。
常用的弱学习器有 Decision Stumps or smaller Decision Trees

2) Ensemble
Boosting 构建的模型最终的输出就是 所以弱学习器的 权重和
The overall model built by Boosting is a weighted sum of all of the weak learners. The weights and training given to each ensures that the overall model yields a pretty high accuracy (sometimes state-of-the-art)

3) Iteratively build 许多组合方法如 bagging/random forests ,这些模型中的弱学习器都可以并行独立训练的,因为这些弱学习器之间没有依赖性。但是 Boosting 不是这样的。 在每个步骤, Boosting 尝试评估当前已构建的模型 shortcomings ,然后生成一个 弱学习器来解决这个 shortcomings ,然后将这个弱学习器加到总体模型中去。所以整个训练过程是序列进行的。

4) Meta-algorithm
因为 Boosting 本身不是一个机器学习算法,它只是将一些基础算法构建成一个强算法,所以说它是 ‘meta’algorithm
Since Boosting isn’t necessarily an ML algorithm by itself, but rather uses other (basic) algorithms to build a stronger one, it is said to be a ‘meta’ algorithm.

How does Boosting work?

通常一个基于 Boosting 框架的回归算法工作流程如下:

在 Boosting 的每个迭代步骤中,通过引入一个新的弱学习器到当前的 ensemble 中来提升当前模型的性能,这个新引入的弱学习器主要负责解决当前模型不能解决的那些样本。 这个ensemble 不仅减少 bias 也同样降低 variance

Each of the iterations in Boosting essentially tries to ‘improve’ the current model by introducing another learner into the ensemble. Having such an ensemble not only reduces the bias (which is generally pretty high for weak learners), but also the variance (since multiple learners contribute to the overall output, each with their own unique training).

Boosting 有很多种版本,其差别主要在上面算法步骤中的一些细节上。
例如 Gradient Boosting 主要的思路是 计算 Loss function 在当前步骤某一 data point 的梯度 gradient ,然后用一个新的弱学习器来学习预测这个梯度 gradient, 这个弱学习器的权重通过最小化损失函数值得到 The weight is then optimized so as to minimize the total Loss value

11

Boosting 简介--A (small) introduction to Boosting相关推荐

  1. Bootstraping, bagging, boosting, AdaBoosting, Rand forest 和 gradient boosting

    这两天在看关于boosting算法时,看到一篇不错的文章讲bootstrap, jackknife, bagging, boosting, random forest 都有介绍,以下是搜索得到的原文, ...

  2. Jackknife,Bootstraping, bagging, boosting, AdaBoosting, Rand forest 和 gradient boosting

     Jackknife,Bootstraping, bagging, boosting, AdaBoosting, Rand forest 和 gradient boosting 这些术语,我经常搞 ...

  3. 【机器学习】Jackknife,Bootstraping, bagging, boosting, AdaBoosting, Rand forest 和 gradient boosting...

    Jackknife,Bootstraping, bagging, boosting, AdaBoosting, Rand forest 和 gradient boosting 这些术语,我经常搞混淆, ...

  4. Jackknife,Bootstraping, bagging, boosting, AdaBoosting, Rand forest 和 gradient boosting的简单介绍

    转之 http://blog.csdn.net/chenhongc/article/details/9404583 http://blog.sina.com.cn/s/blog_5dd2e927010 ...

  5. Jackknife,Bootstraping, bagging, boosting, AdaBoosting, Rand forest 和 gradient boosting的区别

    这些术语,我经常搞混淆,现在把它们放在一起,以示区别.(部分文字来自网络,由于是之前记的笔记,忘记来源了,特此向作者抱歉) Bootstraping: 名字来自成语"pull up by y ...

  6. Jackknife,Bootstrap, bagging, boosting, AdaBoost, Rand forest 和 gradient boosting的区别

    Jackknife,Bootstrap, bagging, boosting, AdaBoost, Rand forest 和 gradient boosting 这些术语,我经常搞混淆,现在把它们放 ...

  7. Jackknife,Bootstraping, bagging, boosting, AdaBoosting, Random forest 和 gradient boosting的区别

    转自:http://blog.csdn.net/xianlingmao/article/details/7712217 Jackknife,Bootstraping, bagging, boostin ...

  8. Decision stump、Bootstraping、bagging、boosting、Random Forest、Gradient Boosting

    1)首先来看看 Decision stump https://en.wikipedia.org/wiki/Decision_stump A decision stump is a machine le ...

  9. boosting算法_集成学习:boosting、BDT、GBDT的概括理解

    boosting是一种集成学习的方法,与bagging并列形成俩中不同的集成学习算法,本文主要概括boosting方法. boosting在训练过程中,它通过改变训练样本的权重,学习多个学习器,然后将 ...

最新文章

  1. 【转】嵌入式产品开发流程
  2. 实现verilog设计控制交通灯
  3. websocket onclose方法什么时候触发_WebSocket断开重连解决方案,心跳重连实践
  4. java模板方法模式_Java中的模板方法模式
  5. Annotation版本的HelloWorld
  6. python如何输入多行数据合并_python 实现将txt文件多行合并为一行并将中间的空格去掉方法...
  7. 电脑提示0xc0000719设备未迁移如何解决
  8. 数据管理流程,基础入门简介
  9. “SQL 被低估了!”
  10. 网易被曝暴力裁患绝症员工,回应:存在不近人情的地方,向前同事道歉
  11. 西北大学研发猴脸识别技术;小米造车未立项;Linux Mint 警告用户安全意识落后 | 极客头条...
  12. java xss 参数_JAVA 重写HttpServletRequest的获取参数防止xss攻击
  13. attachEvent与addEventlistener兼容性
  14. 计算机office软件版本,office哪个版本最好用,你在用的office是哪个版本
  15. 用PS制作电子签名方法总结
  16. python计算所得税费用_Python实现的个人所得税计算器示例
  17. Find a Mother Vertex in a Graph
  18. 只用html如何实现音乐播放,如何使用html实现音乐播放
  19. 区块链供应链金融有着怎样的意义?
  20. [ 工具 ] ___ Browser : Chrome

热门文章

  1. Python 中 zip() 函数的用法
  2. AGGCN | 基于图神经网络的关系抽取模型
  3. Android测试原理概述(一)
  4. php接口 汉字出错 空,php接口开发时,数据解析失败问题,字符转义,编码问题(示例代码)...
  5. php上传图文教程,PHP 上传图片、文件的方法
  6. class.forname()中要写相对路径吗?_Deno 会对 Node 造成威胁吗?
  7. 微生物生态学相关期刊2022年实时影响因子
  8. MPB:林科院袁志林组-​内生镰刀菌基因组染色体级别组装和注释
  9. Nature子刊:整合宏基因组、代谢组和表型分析的的计算框架
  10. R语言ggplot2可视化树状图、层次聚类系统树图、树状图根据给定的距离度量将相似点分组在一起、并根据点的相似性将它们组织成树状图链接起来(Hierarchical Dendrogram)