How do decision trees for regression work?

决策树模型既可以求解分类问题(对应的就是 classification tree),也即对应的目标值是类别型数据,也可以应用于回归预测问题的求解(regression tree),其输出值则可以是连续的实数值。一般市面上介绍决策树模型的书及相关的教学视频,通常只关注决策树在分类问题上的求解,而一笔带过对回归树的介绍。事实上,二者的构建过程也确实没有本质的不同,二者的差异主要集中在划分属性时的划分原则上。

1. SSE

SSE=∑i∈S1|yi−y1¯|+∑i∈S2|yi−y2¯|

\text{SSE} = \sum_{i\in S_1}|y_i-\bar{y_1}|+\sum_{i\in S_2}|y_i-\bar{y_2}|

y1¯,y2¯\bar{y_1},\bar{y_2} 分别表示以当前属性作为划分选择时各自对应的集合 S1S_1 和 S2S_2 目标值的均值。可通过如下的剪枝方式提高魔性的泛化能力:

SSEcp=SSE+cp×St

SSE_{c_p}=SSE+c_p\times S_t

StS_t 用来定义树的规模,也即终端节点的数目。cpc_p 则为可调参数,更小的 cpc_p 将会获得更大的树,该参数可通过交叉验证的方式获得。

2. OLS regression: sum of squared error

3. quantile regression:

用决策树模型求解回归问题(regression tree)相关推荐

  1. 决策树模型回归可视化分析_回归树分析与sklearn决策树案例!

    文 | 菊子皮 (转载请注明出处)同名B站:AIAS编程有道 「摘要:」 决策树是非常基础的算法,其不仅能够进行分类还可以进行回归处理,也就是回归树.要想提高决策树的性能还需要做好剪枝的工作. 「关键 ...

  2. 转载——Regression Tree 回归树

    本文转载于" 一个拉风的名字"的"Regression Tree 回归树" 1. 引言 AI时代,机器学习算法成为了研究.应用的热点.当前,最火的两类算法莫过于 ...

  3. 【Python机器学习】决策树、逻辑回归、神经网络等模型对电信用户流失分类实战(附源码和数据集)

    需要源码和数据集请点赞关注收藏后评论区留言私信~~~ 电信用户流失分类 该实例数据来自kaggle,它的每一条数据为一个用户的信息,共有21个有效字段,其中最后一个字段Churn标志该用户是否流失 1 ...

  4. Regression Tree 回归树

    1. 引言 AI时代,机器学习算法成为了研究.应用的热点.当前,最火的两类算法莫过于神经网络算法(CNN.RNN.LSTM等)与树形算法(随机森林.GBDT.XGBoost等),树形算法的基础就是决策 ...

  5. 逻辑回归Logistic Regression 模型简介

    逻辑回归(Logistic Regression)是机器学习中的一种分类模型,由于算法的简单和高效,在实际中应用非常广泛.本文作为美团机器学习InAction系列中的一篇,主要关注逻辑回归算法的数学模 ...

  6. 机器学习实战(八)分类回归树CART(Classification And Regression Tree)

    目录 0. 前言 1. 回归树 2. 模型树 3. 剪枝(pruning) 3.1. 预剪枝 3.2. 后剪枝 4. 实战案例 4.1. 回归树 4.2. 模型树 学习完机器学习实战的分类回归树,简单 ...

  7. Spark:基于PySpark的逻辑回归和决策树模型对泰旦尼克号幸存者预测的机器学习流程

    pyspark的ML回顾下 文章目录 官网文档 环境 泰坦尼克号数据分析 泰坦尼克号数据清洗整理 Spark ML Pipeline Titanic幸存者预测:逻辑回归LR模型 模型训练 模型预测 T ...

  8. 回归模型(regression model)有哪些指标?如何计算回归指标(regression metrics)?如何可视化他们?

    回归模型(regression model)有哪些指标?如何计算回归指标(regression metrics)?如何可视化他们? metrics.explained_variance_score(y ...

  9. R语言使用lm函数构建多元回归模型(Multiple Linear Regression)、使用step函数筛选最合适的回归变量(逐步回归筛选预测变量的最佳子集)

    R语言使用lm函数构建多元回归模型(Multiple Linear Regression).使用step函数筛选最合适的回归变量(逐步回归筛选预测变量的最佳子集) 目录

最新文章

  1. qteewidgetitem添加子节点_行为树的节点
  2. r语言ggplot怎么把多个维度数据合并在一个图中表示_R语言作图——Histogram
  3. Codeforces Round #741 (Div. 2)
  4. 关于js函数未定义not defined引发的感想
  5. python+unittest框架整理(一点点学习前辈们的封装思路,一点点成长。。。)
  6. python读取txt文件为字典username_如何使用txt和ids将.txt文件内容解析为python中的字典?...
  7. 各种VS Code的学习秘诀,全是这六条法则撑起的!
  8. mybatis--关于接口参数注解的几个小问题
  9. 在Mac环境下查看附近路由器的MAC地址
  10. 通过注册表实现程序开机自启动的方法
  11. 极速office(word)如何在方框内打钩
  12. 如何用Android Stuido 调用百度翻译的API
  13. 小糊涂家装预算软件 官方
  14. GPD MicroPC 安装 Win10+Ubuntu 双系统
  15. golang下文件锁的使用
  16. 由递推关系式用差分方程的方法得到通项公式实现求斐波那契数列的第n项;迭代、递归、栈、差分方程之间的本质联系以及由推广的迭代法解决“变态青蛙跳台阶”问题;汉诺塔问题的数字特征以及用递归解决的原理推导。
  17. 2021-2022-1 20212824《Linux内核原理与分析》第一周作业
  18. 大战在即!手机芯片巨头“All in”智能汽车,5G只是冰山一角
  19. 组件化、模块化、Composing Builds
  20. ROCm 5.4.3 在 ubuntu 20.04 上安装并运行示例

热门文章

  1. FX Composer 2 中文版快速教程
  2. 编写IOCP时的几个注意事项(Mirosoft)
  3. 【java学习之路】(java SE篇)(讨论与思考)异常中的try,catch,return的相关问题
  4. 服务端设置忽略更新_深入理解Kafka服务端之日志对象的读写数据流程
  5. HUE与Oozie的集成
  6. svn提示没有设置冲突_svn代码冲突,不能提交的解决方法
  7. hadoop与mysql的区别_数据库与hadoop与分布式文件系统的区别和联系
  8. docker gpu 创建 训练环境_巧用 Docker 快速部署 GPU 环境
  9. JDBC在spring中的使用
  10. java贪吃蛇客户端服务器_java Socket套接字TCP编程开发服务端和客户端之间的通信 - 贪吃蛇学院-专业IT技术平台...