Boosting

boosting一句话理解:三个臭皮匠,顶个诸葛亮。
在计算机学习理论里,强可学习和弱可学习是等价的。
弱可学习模型转化为强可学习模型方法:前向分布加法模型。

最简单前向分布加法模型

yk+1 = yk + ( y-yk )
( y-yk )即为残差,每一个新的弱分类器学习的目标都是残差
这么一个简单的模型,能否得到我们想要的结果?
理论上( y-yk )只有方向是准确的,具体是多少是模糊的。

进阶用梯度代替残差,即GB

理论上( y-yk )只有方向是准确的,具体是多少是模糊的。
用梯度代替( y-yk ):
yk+1 = yk + ( ak *梯度), ak为步长
这里的梯度就是我们常听说的伪残差,拟合伪残差得到方向,扫描搜索得到最好的步长。

使用指数函数为损失函数,即为Adaboost
使用决策树为分类器,即为GBDT
通过上述算法,我们(x,伪残差)得到方向g,(x,g)得到步长(单变量一元回归)

泰勒展开与GB


GBDT使用上述公式一阶泰勒展开
XGBoosting上述公式二阶泰勒展开
我们知道泰勒二阶展开就是牛顿法,直接求出了方向和步长,不需要线性搜索合适的步长。

XGBoosting

XGBoosting上述公式二阶泰勒展开
我们知道泰勒二阶展开就是牛顿法,直接求出了方向和步长,不需要线性搜索合适的步长。
实际上处理不会一步到位,避免过拟合
详细推导见:https://homes.cs.washington.edu/~tqchen/pdf/BoostedTree.pdf link.
从这里可以看出XGBoost基本还是集成前人的东西,考虑大数据处理,优化并行计算,形成工业级应用才是XGBoost最大作用。

参考学习资料:

https://homes.cs.washington.edu/~tqchen/pdf/BoostedTree.pdf link.
https://arxiv.org/abs/1603.02754

从GB到GBDT到XGBoost相关推荐

  1. 一步一步理解GB、GBDT、xgboost

    GBDT和xgboost在竞赛和工业界使用都非常频繁,能有效的应用到分类.回归.排序问题,虽然使用起来不难,但是要能完整的理解还是有一点麻烦的.本文尝试一步一步梳理GB.GBDT.xgboost,它们 ...

  2. GB与gbdt以及xgboost

    本文转自:博客 GBDT和xgboost在竞赛和工业界使用都非常频繁,能有效的应用到分类.回归.排序问题,虽然使用起来不难,但是要能完整的理解还是有一点麻烦的.本文尝试一步一步梳理GB.GBDT.xg ...

  3. GBDT和XGBoost

    写在最开头,对GB的理解: 1.Gradient Boosting:每一次的计算是为了减少上一次的残差(residual),而为了消除残差,我们可以在残差减少的梯度(Gradient)方向上建立一个新 ...

  4. 数据挖掘算法(logistic回归,随机森林,GBDT和xgboost)-腾讯云社区

    机器学习就是样本中有大量的x(特征量)和y(目标变量)然后求这个function.(了解更多可以看: https://zhuanlan.zhihu.com/p/21340974?refer=mlear ...

  5. RF和GBDT和Xgboost的异同总结,加上lightgbm

    相同点(照顾标题): 都用到了Bootstrap思想,Bootstrap是一种有放回的抽样方法思想 不同点: 基类器: RF用的回归树或者分类树,GBDT和xgboost用的是CART(回归树) 分裂 ...

  6. 面试必备|ID3、C4.5、CART、RF、boosting、Adaboost、GBDT、xgboost模型

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:知乎,笑个不停,https://zhuanlan.zhihu ...

  7. 决策树 随机森林 xgboost_推荐收藏 | 决策树、随机森林、bagging、boosting、Adaboost、GBDT、XGBoost总结...

    作者:ChrisCao https://zhuanlan.zhihu.com/p/75468124 一. 决策树决策树是一个有监督分类模型,本质是选择一个最大信息增益的特征值进行分割,直到达到结束条件 ...

  8. 5000字干货 | 决策树、随机森林、bagging、boosting、Adaboost、GBDT、XGBoost总结

    作者:ChrisCao https://zhuanlan.zhihu.com/p/75468124 大家好,我是小z 今天分享一波机器学习的干货~ 一. 决策树 决策树是一个有监督分类模型,本质是选择 ...

  9. 决策树、随机森林、bagging、boosting、Adaboost、GBDT、XGBoost总结

    作者:ChrisCao https://zhuanlan.zhihu.com/p/75468124 一. 决策树 决策树是一个有监督分类模型,本质是选择一个最大信息增益的特征值进行输的分割,直到达到结 ...

最新文章

  1. 如何处理Docker错误消息:please add——insecure-registry 1
  2. 第2步 安装git 配置git用户 git的安装和项目的建立
  3. 转为yaml python_python 如何使用HttpRunner做接口自动化测试
  4. Leetcode 118 杨辉三角
  5. vue用户行为收集_Vue前端数据采集 埋点 追踪用户系列行为
  6. 【转】打印机硬件发现不了解决办法
  7. Java基础——泛型
  8. 单行文本溢出显示省略号
  9. adb locat 过滤日志-命令行
  10. RTX3070深度学习环境配置
  11. 【Day4.3】大皇宫内蹭讲解
  12. 信息检索导论要点整理
  13. java 给一个开学日期,计算当天是开学第几周星期几或者开学第几周星期几为哪一天
  14. excel 如何用公式函数去除单元格的空格和回车 并进行 单元格字符串比对
  15. 肾有多好,就有多年轻
  16. linux内存相关命令汇总
  17. 国内公募REITs火了 5月31号3多亿亿明天开抢!怎么买?买哪只?10问10答解读来了
  18. 使用MPAndroidChart图标遇到的坑-X轴文字显示不全问题
  19. 实用新型专利和发明专利区别如何区分实用新型专利和发明专利
  20. 本质矩阵 基础矩阵 单应性矩阵

热门文章

  1. 计算机省赛教案,《计算机系统的组成》最新 参赛教案.doc
  2. SpringBoot+MyBatis登录案例
  3. java 网络编程 博客园_java网络编程
  4. skype可以卸载吗_Skype、WhatsApp登录不上、经常掉线如何解决?史上最强攻略
  5. e2fsck -y 故障_MC2-XWHM-Y
  6. linux 工具 SecureCRT 使用 rz 和 sz 命令
  7. 更改tomcat的request编码方式
  8. MySQL5.5的安装,连接和操作
  9. c语言大作业菜单,C语言大作业:编写菜单控制猜商品价格程序
  10. android oom 检测工具,Android中UI检测、内存泄露、OOM、等优化处理