从GB到GBDT到XGBoost
Boosting
boosting一句话理解:三个臭皮匠,顶个诸葛亮。
在计算机学习理论里,强可学习和弱可学习是等价的。
弱可学习模型转化为强可学习模型方法:前向分布加法模型。
最简单前向分布加法模型
yk+1 = yk + ( y-yk )
( y-yk )即为残差,每一个新的弱分类器学习的目标都是残差
这么一个简单的模型,能否得到我们想要的结果?
理论上( y-yk )只有方向是准确的,具体是多少是模糊的。
进阶用梯度代替残差,即GB
理论上( y-yk )只有方向是准确的,具体是多少是模糊的。
用梯度代替( y-yk ):
yk+1 = yk + ( ak *梯度), ak为步长
这里的梯度就是我们常听说的伪残差,拟合伪残差得到方向,扫描搜索得到最好的步长。
使用指数函数为损失函数,即为Adaboost
使用决策树为分类器,即为GBDT
通过上述算法,我们(x,伪残差)得到方向g,(x,g)得到步长(单变量一元回归)
泰勒展开与GB
GBDT使用上述公式一阶泰勒展开
XGBoosting上述公式二阶泰勒展开
我们知道泰勒二阶展开就是牛顿法,直接求出了方向和步长,不需要线性搜索合适的步长。
XGBoosting
XGBoosting上述公式二阶泰勒展开
我们知道泰勒二阶展开就是牛顿法,直接求出了方向和步长,不需要线性搜索合适的步长。
实际上处理不会一步到位,避免过拟合
详细推导见:https://homes.cs.washington.edu/~tqchen/pdf/BoostedTree.pdf link.
从这里可以看出XGBoost基本还是集成前人的东西,考虑大数据处理,优化并行计算,形成工业级应用才是XGBoost最大作用。
参考学习资料:
https://homes.cs.washington.edu/~tqchen/pdf/BoostedTree.pdf link.
https://arxiv.org/abs/1603.02754
从GB到GBDT到XGBoost相关推荐
- 一步一步理解GB、GBDT、xgboost
GBDT和xgboost在竞赛和工业界使用都非常频繁,能有效的应用到分类.回归.排序问题,虽然使用起来不难,但是要能完整的理解还是有一点麻烦的.本文尝试一步一步梳理GB.GBDT.xgboost,它们 ...
- GB与gbdt以及xgboost
本文转自:博客 GBDT和xgboost在竞赛和工业界使用都非常频繁,能有效的应用到分类.回归.排序问题,虽然使用起来不难,但是要能完整的理解还是有一点麻烦的.本文尝试一步一步梳理GB.GBDT.xg ...
- GBDT和XGBoost
写在最开头,对GB的理解: 1.Gradient Boosting:每一次的计算是为了减少上一次的残差(residual),而为了消除残差,我们可以在残差减少的梯度(Gradient)方向上建立一个新 ...
- 数据挖掘算法(logistic回归,随机森林,GBDT和xgboost)-腾讯云社区
机器学习就是样本中有大量的x(特征量)和y(目标变量)然后求这个function.(了解更多可以看: https://zhuanlan.zhihu.com/p/21340974?refer=mlear ...
- RF和GBDT和Xgboost的异同总结,加上lightgbm
相同点(照顾标题): 都用到了Bootstrap思想,Bootstrap是一种有放回的抽样方法思想 不同点: 基类器: RF用的回归树或者分类树,GBDT和xgboost用的是CART(回归树) 分裂 ...
- 面试必备|ID3、C4.5、CART、RF、boosting、Adaboost、GBDT、xgboost模型
点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:知乎,笑个不停,https://zhuanlan.zhihu ...
- 决策树 随机森林 xgboost_推荐收藏 | 决策树、随机森林、bagging、boosting、Adaboost、GBDT、XGBoost总结...
作者:ChrisCao https://zhuanlan.zhihu.com/p/75468124 一. 决策树决策树是一个有监督分类模型,本质是选择一个最大信息增益的特征值进行分割,直到达到结束条件 ...
- 5000字干货 | 决策树、随机森林、bagging、boosting、Adaboost、GBDT、XGBoost总结
作者:ChrisCao https://zhuanlan.zhihu.com/p/75468124 大家好,我是小z 今天分享一波机器学习的干货~ 一. 决策树 决策树是一个有监督分类模型,本质是选择 ...
- 决策树、随机森林、bagging、boosting、Adaboost、GBDT、XGBoost总结
作者:ChrisCao https://zhuanlan.zhihu.com/p/75468124 一. 决策树 决策树是一个有监督分类模型,本质是选择一个最大信息增益的特征值进行输的分割,直到达到结 ...
最新文章
- 如何处理Docker错误消息:please add——insecure-registry 1
- 第2步 安装git 配置git用户 git的安装和项目的建立
- 转为yaml python_python 如何使用HttpRunner做接口自动化测试
- Leetcode 118 杨辉三角
- vue用户行为收集_Vue前端数据采集 埋点 追踪用户系列行为
- 【转】打印机硬件发现不了解决办法
- Java基础——泛型
- 单行文本溢出显示省略号
- adb locat 过滤日志-命令行
- RTX3070深度学习环境配置
- 【Day4.3】大皇宫内蹭讲解
- 信息检索导论要点整理
- java 给一个开学日期,计算当天是开学第几周星期几或者开学第几周星期几为哪一天
- excel 如何用公式函数去除单元格的空格和回车 并进行 单元格字符串比对
- 肾有多好,就有多年轻
- linux内存相关命令汇总
- 国内公募REITs火了 5月31号3多亿亿明天开抢!怎么买?买哪只?10问10答解读来了
- 使用MPAndroidChart图标遇到的坑-X轴文字显示不全问题
- 实用新型专利和发明专利区别如何区分实用新型专利和发明专利
- 本质矩阵 基础矩阵 单应性矩阵
热门文章
- 计算机省赛教案,《计算机系统的组成》最新 参赛教案.doc
- SpringBoot+MyBatis登录案例
- java 网络编程 博客园_java网络编程
- skype可以卸载吗_Skype、WhatsApp登录不上、经常掉线如何解决?史上最强攻略
- e2fsck -y 故障_MC2-XWHM-Y
- linux 工具 SecureCRT 使用 rz 和 sz 命令
- 更改tomcat的request编码方式
- MySQL5.5的安装,连接和操作
- c语言大作业菜单,C语言大作业:编写菜单控制猜商品价格程序
- android oom 检测工具,Android中UI检测、内存泄露、OOM、等优化处理