This is a memo to share what I have learnt in Machine Learning with Tree-Based Models (using Python), capturing the learning objectives as well as my personal notes. The course is taught by Elie Kawerk from DataCamp.

这是一份备忘录,分享了我在基于树的模型(使用Python)的机器学习中学到的知识,记录了学习目标以及我的个人笔记。 该课程由DataCamp的Elie Kawerk教授。

Decision trees are supervised learning models used for problems involving classification and regression.

决策树是用于涉及分类和回归问题的监督学习模型。

I have learnt the following topics:

我已经学习了以下主题:

  • Use Python to train decision trees and tree-based models.

    使用Python训练决策树和基于树的模型。

    Decision-Tree Learning, applying CART algorithm to train decision trees for classification/regression problems.

    决策树学习,应用CART算法训练分类/回归问题的决策树。

  • Generalization Error of a supervised learning model, to diagnose underfitting and overfitting using Cross-Validation.

    监督学习模型的泛化误差,用于使用交叉验证诊断拟合不足和拟合过度。

    Ensembling can produce better results than individual decision trees.

    组合可以比单独的决策树产生更好的结果。

  • Advantages and disadvantages of trees.

    树木的优缺点。

    Bagging, applied randomization through bootstrapping and constructed a diverse set of trees in an ensemble through bagging.

    套袋,通过自举应用随机化,并通过套袋在合奏中构建出一组不同的树。

    Random Forests introduces further randomization by sampling features at the level of each node in each tree forming the ensemble.

    随机森林通过在形成整体的每棵树中每个节点的级别上对特征进行采样来引入进一步的随机化。

  • AdaBoost and Gradient-Boosting, ie, an ensemble method in which predictors are trained sequentially and each predictor tries to correct the errors made by its predecessors.

    AdaBoost和Gradient-Boosting,即一种集成方法,在该方法中,对预测变量进行顺序训练,并且每个预测变量都尝试纠正其前辈产生的错误。

    Subsampling instances and features can lead to a better performance through Stochastic Gradient Boosting.

    二次采样实例和功能可以通过随机梯度增强来提高性能。

  • Model hyperparameter tuning through Grid Search CV.通过Grid Search CV进行模型超参数调整。

More notes and codes can be found on my GitHub.

在我的GitHub上可以找到更多注释和代码。

Overall, I have enjoyed learning this course and would highly recommend it!

总的来说,我很喜欢学习这门课程,并强烈推荐它!

翻译自: https://medium.com/ai-in-plain-english/machine-learning-with-tree-based-models-51261c4eaae6


http://www.taodudu.cc/news/show-863373.html

相关文章:

  • 数据分析模型和工具_数据分析师工具包:模型
  • 图像梯度增强_使用梯度增强机在R中进行分类
  • 机器学习 文本分类 代码_无需担心机器学习-如何在少于10行代码中对文本进行分类
  • lr模型和dnn模型_建立ML或DNN模型的技巧
  • 数量和质量评价模型_数量对于语言模型可以具有自己的质量
  • mlflow_使用MLflow跟踪进行超参数调整
  • 聊天产生器
  • 深度学习领域专业词汇_深度学习时代的人文领域专业知识
  • 图像分类
  • CSDN-Markdown基本语法
  • python3(一)数字Number
  • python3(二)Numpy
  • python3(三)Matplotlib
  • python3(四)Pandas库
  • python3(六)监督学习
  • pycharm中如何调用Anoconda的库
  • TensorFlow(四)优化器函数Optimizer
  • TensorFlow(三)常用函数
  • TensorFlow(五)常用函数与基本操作
  • TensorFlow(六)with语句
  • Pycharm如何选择自动打开最近项目
  • CSDN-Markdown编辑器如何修改图像大小
  • TensorFlow(七)tf.nn库
  • TensorFlow(八)激活函数
  • TensorFlow(九)eval函数
  • TensorFlow(十)定义图变量的方法
  • TensorFlow读取MNIST数据集错误的问题
  • Tensorflow(一) 基础命令
  • TensorFlow(二)函数基础
  • TensorFlow:实战Google深度学习框架(二)实现简单神经网络

基于树的模型的机器学习相关推荐

  1. 基于树的模型的更好功能

    When you understand how a model works, it becomes much easier to create successful features. It is b ...

  2. 为何基于树的模型在表格型数据中能优于深度学习?

    为何基于树的模型在表格型数据中能优于深度学习? FesianXu 20220908 at Baidu Search Team 前言 基于树的模型(Tree-based model),比如GBDT,XG ...

  3. 深度学习用于医学预后-第二课第四周1-4节-使用线性和基于树的模型构建风险评估模型

    今天起进入到第四周课程的学习,使用线性和基于树的模型构建风险评估模型 风险分数 本周,你将学习建立和评估生存预测模型的策略,这些模型将使你能够比较个体患者的风险.您将学习两个这样的模型:Cox比例风险 ...

  4. 第二课第二周第1-5节-基于树的模型用于医学预后

    本周,我们将使用决策树(Decision Trees)构建我们的第一个机器学习模型.树(trees)在医学应用中非常有用的的原因是:1️⃣ 它们处理连续和分类数据的能力,2️⃣ 它们的可解释性以及训练 ...

  5. 为基于树的机器学习模型构建更好的建模数据集的10个小技巧!

    https://www.toutiao.com/a6680019995100971531/ 为了使模型更准确 - 只需对所有分类特征进行独热编码并将所有缺失值归零都可能是不够的. 假设有一个业务问题可 ...

  6. 基于树的机器学习模型的演化

    基于树的分类模型是一种监督机器学习算法,它使用一系列条件语句将训练数据划分为子集.每一次连续的分割都会给模型增加一些复杂性,这些复杂性可以用来进行预测.最终结果模型可以可视化为描述数据集的逻辑测试的路 ...

  7. 用树型模型管理App数字和红点提示

    我们平常接触到的大部分App,在收到新消息的时候一般都会以数字或红点的形式提示出来.比如在微信当中,当某位好友给我们发来新的聊天消息的时候,在相应的会话上就会有一个数字来表示未读消息的数目:再比如当微 ...

  8. 用树型模型管理App数字和红点提示(附源码Demo)

    我们平常接触到的大部分App,在收到新消息的时候一般都会以数字或红点的形式提示出来.比如在微信当中,当某位好友给我们发来新的聊天消息的时候,在相应的会话上就会有一个数字来表示未读消息的数目:再比如当微 ...

  9. R语言rpartb包树回归模型构建:基于前列腺prostate数据集

    R语言rpartb包树回归模型构建:基于前列腺prostate数据集 决策树是一种机器学习的方法.决策树的生成算法有ID3, C4.5和C5.0等.决策树是一种树形结构,其中每个内部节点表示一个属性上 ...

最新文章

  1. CSS之布局(外边距的折叠)
  2. Martix工作室考核题 —— 2019-3-8 第一题
  3. Tango+Daydream,刀剑合璧的Android VR开发
  4. SpringBoot项目在idea中运行正常,打包jar包后运行报NoClassDefFoundError和UnsatisfiedDependencyException解决方案...
  5. 常见视频接口介绍,VGA,YPbPr,DVI,HDMI,DisplayPort
  6. 软件工程---18.面向服务的软件工程
  7. XML_CPP_资料_libXml2_01
  8. python基础语法加爬虫精进_从Python安装到语法基础,这才是初学者都能懂的爬虫教程...
  9. java上下左右_上下左右代替maquee的滚动代码
  10. 【工具】ColorPix!分享一个超好用的桌面取色工具
  11. UWB定位系统可以实现什么功能
  12. Synopsys系列工具的基本概念
  13. 易企秀怎么转换成html5,易企秀怎么免费制作h5?
  14. 【Shader案例】镜面反射
  15. c++如何制作背景音乐
  16. 用html和css制作钟表,使用HTML5和CSS3制作简单的钟表
  17. 【全奖博士】香港大学招收计算机视觉方向博士/博后/研究助理
  18. Mac/Win上运行Switch游戏(亲测可用)
  19. 软件项目需求管理培训
  20. Cookie.setSecure(true)解释

热门文章

  1. 在C++中反射调用.NET(二)
  2. 实现OC与JS的交互
  3. [最新下载] 【火车票订票外挂】Go-Home–12306.cn 网上火车票自动订票程序
  4. RHCE实验室NTP时间服务器配置最终版
  5. 关于本地共享文件夹会话连接时间
  6. zigbee协议_智能家居的ZigBee到底是什么?和Wi-Fi有何区别?
  7. latex中怎样写上标_LaTex:参考文献引用的方法
  8. php object添加到数组,PHP Object转换为数组array
  9. ROS2学习(十).ROS概念 - 主题的统计
  10. CST normalize S-parameter to given impedance