集成学习(中)

开源内容:

https://github.com/datawhalechina/team-learning-data-mining/tree/master/EnsembleLearning

基本信息

  • 贡献人员:李祖贤、薛传雨、赵可、杨毅远、陈琰钰、李嘉骐
  • 学习周期:12天
  • 学习形式:理论学习 + 练习
  • 组队学习说明:上期学习大家系统了解了机器学习的经典的算法数学推导和代码调用,本期我们将进行bagging/boosting等基本集成方法以及常见的集成方法组合的学习。我们依然对于每个算法都进行了细致的理论分析以及必要的代码演示,希望大家的理论知识水平和代码实践能力两个方面都能够获得均衡的提高。在案例的代码中,我们给出了详细的代码注释,尽量让学习者们不会因为看不懂代码而感到烦恼。
  • 人群定位:已完成机器学习(上)课程内容的学习,具备《高等数学》、《线性代数》、《概率论与数理统计》基础,了解机器学习经典模型的理论知识,能够调用相应模型库解决的学习者。
  • 每个任务完成大概所需时间:3-5h
  • 任务路线:掌握基本的模型集成方法和常见组合集成模型的理论及模型调用调参
  • 难度系数:中

⚠️ 特别提示:已报名并完成集成学习(上)所有学习内容的同学不需要重复报名。直接报名集成学习(中)的同学需要自行完成集成学习(上)课程内容的学习。

学习目标

本次课程是由Datawhale集成学习小组内部成员共同完成,是针对机器学习小白的一入门课程。学习本课程需要学习者具备《高等数学》、《线性代数》、《概率论与数理统计》基础,会使用常见的数据分析工具(Numpy,Pandas、matplotlib)。

本次课程内容的设计参考了B站很火的《白板推导》系列、李航老师的《统计学习方法》、机器学习入门圣经的《统计学习导论》以及大量的技术博客,详细地介绍了机器学习领域中最经典的算法并给出了相应的数学推导和代码,对于每个算法都进行了细致的分析以及必要的代码的演示,便于学习者深刻理解机器学习算法的本质。除此之外,每个算法都要求学习者自行查阅sklearn官方文档的相应参数,帮助学习者构建理论与实际相结合的学习框架。在这些案例的代码中,我们给出了详细的代码注释,尽量让学习者们不会因为看不懂代码而感到烦恼。

开营视频

加入视频内容

内容介绍


【组队学习】【24期】集成学习(中)相关推荐

  1. 深度学习auc_机器学习集成学习与模型融合!

    ↑↑↑关注后"星标"Datawhale每日干货 & 每月组队学习,不错过Datawhale干货 作者:李祖贤,深圳大学,Datawhale高校群成员 对比过kaggle比赛 ...

  2. 【数据科学系统学习】机器学习算法 # 西瓜书学习记录 [12] 集成学习实践

    本篇内容为<机器学习实战>第 7 章利用 AdaBoost 元算法提高分类性能程序清单.所用代码为 python3. AdaBoost 优点:泛化错误率低,易编码,可以应用在大部分分类器上 ...

  3. Stacking 集成学习在多因子选股中的应用

    Stacking 集成学习模型简介 Stacking 集成学习的原理 Stacking 是一种常见的集成学习框架.一般来说,Stacking 将训练一个多层(一般是两层, 本文中默认两层)的模型结构, ...

  4. 【直播】李祖贤:集成学习答疑直播之五 -- 常用集成思路

    集成学习答疑直播之五 – 常用集成思路   集成学习 是首个横跨3个周期的长期组队学习,在 第24期组队学习 中进行到"第二期-模型集成思路"阶段.组队学习期间,课程设计者每周针对 ...

  5. 集成学习:lightGBM(二)

    日萌社 人工智能AI:Keras PyTorch MXNet TensorFlow PaddlePaddle 深度学习实战(不定时更新) 集成学习:Bagging.随机森林.Boosting.GBDT ...

  6. 【周志华机器学习】八、集成学习

    文章目录 参考资料 1. 基本概念 1.1 个体与集成 2. Boosting 3. Bagging 4.随机森林 5. 结合策略 5.1 平均法(回归问题) 5.2 投票法(分类问题) 5.3 学习 ...

  7. 集成学习:Bagging、随机森林、Boosting、GBDT

    日萌社 人工智能AI:Keras PyTorch MXNet TensorFlow PaddlePaddle 深度学习实战(不定时更新) 集成学习:Bagging.随机森林.Boosting.GBDT ...

  8. 机器学习算法大汇总--线性回归、逻辑回归、正则化、神经网络、SVM、K-Means、PCA、集成学习等!

    本文很长~请耐心观看 另:本文主要用于本人的复习使用,欢迎大佬的指正和添加. 还有:本人也只是初出茅庐,希望大佬手下留情,谢谢!! 1.算法分类 机器学习算法分为: 有监督,无监督 两大阵营 1.有监 ...

  9. [白话解析] 通俗解析集成学习之bagging,boosting 随机森林

    [白话解析] 通俗解析集成学习之bagging,boosting & 随机森林 0x00 摘要 本文将尽量使用通俗易懂的方式,尽可能不涉及数学公式,而是从整体的思路上来看,运用感性直觉的思考来 ...

  10. 机器学习读书笔记:集成学习

    文章目录 集成学习 AdaBoost 代码 Bagging与随机森林 Bagging 随机森林(Random Forest) 结合策略 增加多样性的策略 多样性度量 集成学习 ​ 之前已经讲过了好几个 ...

最新文章

  1. Hbase Compaction 源码分析 - CompactionChecker
  2. Hive 大小表关联查询异常
  3. ubuntu 软件包管理工具 dpkg,apt-get,aptitude 区别
  4. 本科生 计算机图形学试卷,湖南工程学院《计算机图形学》毕业补考试卷及答案...
  5. Could not calculate build plan
  6. python的dataframe的groupby_python pandas.DataFrame.groupby()方法详解
  7. 《剑指offer》-中序遍历下一个节点
  8. 基于动力学前馈加反馈线性化的机器人动力学控制实现
  9. smartprinter注册版_SmartPrinter免费版
  10. 产品经理的私房菜 - 腾讯产品模型 - 学习能力篇
  11. 体渲染-------颜色、不透明度调整
  12. 一文带你读懂 Java Agent 内存马
  13. win10安装Adobe 2022全新体验安装教程 你觉得到底香不香
  14. wh计算公式_阀门扭矩计算公式
  15. 用java做考试管理系统,考试管理系统的开发实现(Java+Web)
  16. 安卓调用系统相机拍照并且显示在ImageView上
  17. Android课设之校园二手交易app
  18. 钉钉在线课程开启屏幕共享时电脑蓝屏问题解决办法
  19. cpu是几核的怎么查看
  20. 【HTML5】H5新标签大实例

热门文章

  1. 神经网络基础知识梳理
  2. JVM堆 栈 方法区详解
  3. Spring Cloud入门教程 - Zuul实现API网关和请求过滤
  4. 一分钟了解 TCP/IP 模型
  5. shell脚本编程基础(1)及RAID阵列
  6. mysql基于replication实现最简单的M-S主从复制
  7. fragment类onresume里面刷新操作处理
  8. 让你的网站支持 Emoji
  9. centos6.6 Kickstart无人值守安装(一):原理篇
  10. eclipes 安装 pytdev,svn,插件