集成算法:-1. Bagging随机森林多个基模型的构建是基于不同数据来构建-2. Boosting通过迭代的形式基于之前构建好的模型,对样本数据做一定的修正,然后影响之后的模型构建,模型构建的方向或者目的:让预测更准,让误差更小。Adaboost通过修正样本的权重GBDT通过修正样本的预测值label标签值-3. Stacking

01_XGBoost概述

02_XGBoost安装讲解

07:29- 讲解XGBoot的官网,以及安装

03_XGBoost原理讲解一

决策树:构建的方向:让数据集更纯,每次选择划分之后纯度变化最大的这个特征作为数据的划分特征纯的度量指标:信息熵、gini系数、错误率、MSE、MAE划分特征选择的衡量指标:信息增益、信息增益率算法:ID3分类决策树、多分枝的决策树C4.5分类决策树、多分枝的决策树CART分类&回归的决策树、二分枝的决策树

3.1 GBDT 的目标函数

**43: 36 - 01:30 XGBoost公式推导

为什么要考虑损失函数?

XGBoost和GBDT比较-1. XGBoost在GBDT的基础上加入了正则化项,防止模型过拟合-2. XGBoost在构建的过程中考虑的二阶导函数,GBDT只考虑一阶导函数-3. XGBoost中的决策树的构建是基于损失函数,GBDT内的决策树(CART)是基于MSE\MAE\Gini系数....  -4. XGBoost中支持列采样(类似随机森林的方式),可以降低过拟合的情况-5. XGBoost的并行计算指的是划分特征选择过程中是并行计算的-6. XGBoost底层支持CART、线性回归、逻辑回归等多种算法,GBDT只支持CART。

**01:21-01:26???

 解析:
1、列采样:不会取所有的值,只取部分值
2、把缺失值当做一种特征
3、并行计算指的是划分特征选择过程中是并行计算的,模型的构建还是串行的
5、底层支持CART、线性回归、逻辑回归等多种算法,GBDT只支持CART
6、一般情况下不会自定义损失函数

06_聚类算法概述_转

** 01:30- 01:51

分类: objective: binary:logistic
回归: objective: reg:linear

*01:30-01:32 01:36-01:40:15  通过官网看api

http://xgboost.readthedocs.io/en/latest/python/python_api.html#modulexgboost.sklearn

注意:1、如果不做模型的参数调优,优先选择GBDT(相对稳定)2、当GBDT的运行速度和运行效果达不到要求的时候,这时候使用XGBOOT(需要调参)

11.XGBoost相关推荐

  1. 数据竞赛利器XGBoost常见面试题集锦

    XGBoost的威名想必大家都有所耳闻,它不仅是数据科学竞赛神器,在工业界中也被广泛地使用.本文给大家分享珍藏了多年的XGBoost高频面试题,希望能够加深大家对XGBoost的理解,更重要的是能够在 ...

  2. 菜菜sklearn——XGBoost(3)

    4 XGBoost应用中的其他问题 4.1 过拟合:剪枝参数与回归模型调参 class xgboost.XGBRegressor (max_depth=3, learning_rate=0.1, n_ ...

  3. 推荐:数据竞赛的利器XGBoost的常见面试题

    XGBoost的威名想必大家都有所耳闻,它不仅是数据科学竞赛神器,在工业界中也被广泛地使用.本文给大家分享珍藏了多年的XGBoost高频面试题,希望能够加深大家对XGBoost的理解,更重要的是能够在 ...

  4. 机器学习——XgBoost特征筛选

    目录 1. 什么是Xgboost 2. Xgboost的优点 2.1 正则化 2.2 并行处理 2.3 灵活性 2.4 缺失值处理 2.5 剪枝 2.6 内置交叉验证 3. Xgboost模型详解 3 ...

  5. 20道XGBoost面试题

    20道XGBoost面试题 20道XGBoost面试题 XGBoost的威名想必大家都有所耳闻,它不仅是数据科学竞赛神器,在工业界中也被广泛地使用.本文给大家分享珍藏了多年的XGBoost高频面试题, ...

  6. 集成学习-xgboost学习

    XGboost相关学习 from xgboost import XGBRegressor as XGBR from sklearn.ensemble import RandomForestRegres ...

  7. 2018:数据科学20个最好的Python库

     作者 | ActiveWizards 译者 | 婉清 编辑 | 阿司匹林 出品 | AI科技大本营(公众号ID:rgznai100) Python 在解决数据科学任务和挑战方面继续处于领先地位. ...

  8. 盘点数据科学20个最好的Python库(附链接)

    来源:网络大数据 本文约3000字,建议阅读6分钟. 本文将给大家介绍数据科学领域20个最好的Python库. Python 在解决数据科学任务和挑战方面继续处于领先地位.去年,我们曾发表一篇博客文章 ...

  9. python 统计组合用什么库_Python数据科学,用这些库就够了

    为了方便学习,本文列出的20个Python库将按领域进行分类,有些你可能并不熟悉,但是真的能提高你的模型算法实现效率,多一点尝试,多一些努力! ▌核心库和统计数据 1. NumPy (Commits: ...

最新文章

  1. 业界丨涨薪20%!听听这位资深机器学习面试官的内心独白
  2. 浅析网站如何快速提升收录量?
  3. Codechef SEAARC Sereja and Arcs (分块、组合计数)
  4. Google比Baidu快(发一个无聊的帖)
  5. 使用 CometD、Apache 和 Camel 的 502 代理错误
  6. HDU1232 畅通工程【并查集】
  7. Linux基础命令---ziinfo
  8. SaveRasterFile failed: IDLnaMetadata Error:naGetMetadata-GetMetadataJob failed
  9. yolov3-tiny 训练一个检测器(1)
  10. Python ICMP扫描
  11. 计算机核心期刊新排名(八大学报)
  12. 查找Excel最后一个非空单元格的值,你会吗?(适用于数据加行时,一直引用最后一个非空单元格的值)
  13. Mac 开机慢、反应慢,可清理缓存
  14. Elasticsearch 7.X 性能优化
  15. Android中Vitamio使用解析-电视台直播为例
  16. 单线激光雷达与多线激光雷达
  17. 高斯混合模型与EM算法求解
  18. Shell编程 大学生速通攻略(持续更新)
  19. 2019.1月份学习总结
  20. 使用nodemailer来发邮件

热门文章

  1. Cadence Allegro导出Gerber步骤
  2. STM32L0xx_HAL_Driver库的使用——UART续
  3. 第四代数据平台技术:数据云平台
  4. 新窗口打开超链接的技巧
  5. 成功解决 MDK5下载软件包(Software Packs)慢的问题
  6. GAMES104-游戏引擎的动画基础
  7. python五子棋游戏大作业_python-大作业之五子棋游戏(附代码)
  8. android pdfview 显示目录,Android 查看pdf文档——PDFView
  9. 开发者实验室体验之文智自然语言处理SDK by python
  10. ulock 密码忘记如何破解?