在介绍分位数回归之前,先重新说一下回归分析,我们之前介绍了线性回归、多项式回归等等,基本上,都是假定一个函数,然后让函数尽可能拟合训练数据,确定函数的未知参数。尽可能拟合训练数据,一般是通过最小化MSE来进行:

所以得到的y本质上就是一个期望。

根据上面的分析,我们可以得到一个结论,我们前面所有回归分析得到的函数,本质上就是一个条件期望函数,在x等于某个值的条件下,根据数据,求y的期望。

分位数回归提出的原因,就是因为不希望仅仅是研究y的期望,而是希望能探索y的完整分布状况,或者说可能在某些情况下我们更希望了解y的某个分位数。下面再举一个例子,说明分位数回归的作用,假如现在我们有一个如图分布的数据,对其进行普通的回归分析,得到:

从拟合的曲线我们就可以看出问题了,原数据随着x增大,y的分布范围越来越大,可是因为普通的回归分析得到的是条件期望函数,也就是y的期望,所以平均即使y的分布变化了,平均来说y还是以同样的斜率稳定上升,当我们使用0.9分位数回归,重新得出新函数图像:

这次,比起普通的回归分析,就能进一步显示出y的变化幅度其实是增大了。所谓的0.9分位数回归,就是希望回归曲线之下能够包含90%的数据点(y),这也是分位数的概念,分位数回归是把分位数的概念融入到普通的线性回归而已。

当然,我们仅仅得到0.9分位数回归曲线是不够的,进一步的我们可以画出不同的分位数回归曲线,这样才能能更加明显地反映出,随着x的增大,y的不同范围的数据是不同程度地变化的,而这个结论通过以前的回归分析是无法得到的,这就是分位数回归的作用。

我们可以最小化以下函数确定分位数:

本质上,这就是一个加权最小二乘法(虽然形式上有点不一样),给不同的y值(大于分位点和小于分位点的y)不同的权重,比如现在我们有一个数据集是1到10各整数,我们希望求0.7分位数,假设这个0.7分位数是q,然后所有大于q的数都被赋上权重0.7,小于q的赋予权重0.3,我们要最小化函数Q(tau)求分位数,验证一下就可以知道7就是我们要求的分位点。

接下来我想再详细比较这个求分位点的函数和之前求期望的最小二乘法,关于函数Q(tau),我们可以再改写一下:

写成这个形式就彻底变成我们熟悉的加权最小二乘法了,所以说本质上他们都是一样的,而且最小化这个函数同样可以求出分位点。我们以前用最小二乘法得到均方误差作为回归模型的损失函数,因而得到的结果是条件期望函数,如果我们把损失函数换成这里的加权最小二乘函数:

得到的结果也应该符合分位数的定义,也就是说,比如我们使tau=0.8,那么我们最小化损失函数求参数,得到的回归曲线f,应该有80%的数据在曲线的下方。

所以,分位数回归,不能说是一种回归模型,而是一类回归模型,或者说是一种改进思想,我们可以把它应用到线性回归、多项式回归、核回归等等,最根本的就是把损失函数从最小二乘法改成加权最小二乘法,通过不同的分位数得到不同的结果,再根据结果进行分析。

分位数回归(Quantile Regression)相关推荐

  1. R语言分位数回归Quantile Regression分析租房价格

    全文链接:http://tecdat.cn/?p=18422 本文想在R软件中更好地了解分位数回归优化.在查看分位数回归之前,让我们从样本中计算中位数或分位数(点击文末"阅读原文" ...

  2. 【regression】分位数回归 quantile regression

    quantile regression --python实现 前言 分位数回归可调用的库 1. scikit-learn 2. statsmodels quantile loss function - ...

  3. Stata分位数回归I:理解边际效应和条件边际效应

    全文阅读:Stata分位数回归I:理解边际效应和条件边际效应| 连享会主页 目录 1. 简介 2. 从线性回归模型开始 3. 三种边际效应解释 3.1 个体效应--对 "我" 来说 ...

  4. R中怎么做加权最小二乘_Stata+R:分位数回归一文读懂

    NEW!连享会·推文专辑: Stata资源 | 数据处理 | Stata绘图 | Stata程序 结果输出 | 回归分析 | 时间序列 | 面板数据 | 离散数据 交乘调节 | DID | RDD   ...

  5. 用R语言的quantreg包进行分位数回归

    什么是分位数回归 分位数回归(Quantile Regression)是计量经济学的研究前沿方向之一,它利用解释变量的多个分位数(例如四分位.十分位.百分位等)来得到被解释变量的条件分布的相应的分位数 ...

  6. R构建分位数回归模型(Quantile Regression)

    R构建分位数回归模型(Quantile Regression) 目录 R构建分位数回归模型(Quantile Regression) 数据集 分位数回归模型

  7. 多项式回归、分位数回归(Quantile Regression)、保序回归(Isotonic Regression)、RANSAC回归、核岭回归、基准回归模型(baseline)

    多项式回归.分位数回归(Quantile Regression).保序回归(Isotonic Regression).RANSAC回归.核岭回归.基准回归模型(baseline) 目录

  8. 分位数回归(Quantile regression)笔记

    分位数回归(Quantile regression)是在给定 X \mathbf{X} X的条件下估计 y \mathbf{y} y的中位数或其他分位数, 这是与最小二乘法估计条件均值最大的不同. 分 ...

  9. R语言构建分位数回归(Quantile Regression)并计算R方指标实战

    R语言构建分位数回归(Quantile Regression)并计算R方指标实战 目录 R语言构建分位数回归(Quantile Regression)并计算R方指标实战 R方指标 调整的R方指标

  10. 分位数回归(Quantile Regression)代码解析

    实验代码 本文采用python sklearn库中,作为quantile regression的示例代码.以下为详细解析: import numpy as np import matplotlib.p ...

最新文章

  1. 「我要出轨了」!伯克利的这个AI,可以预测机器人何时将脱离
  2. mysql 中遍历查询_mysql中循环查询
  3. Visual C++下对匿名管道的编程实现
  4. equipment hierarchy download不完整的一个原因
  5. Spring Boot log4j2 configuration example
  6. jdbctemplate mysql 配置_Spring JDBCTemplate配置使用
  7. Pytorch LSTM实例2
  8. JeecgBoot 2.x版本SQL漏洞补丁发布——响应零日漏洞修复计划
  9. jQuery插件素材网站
  10. eclipse调试java web_eclipse调试web项目
  11. 8.1 模型压缩的方法
  12. LeetCode 623. Add One Row to Tree
  13. 在虚幻引擎5中构建你的首款游戏 - 03 - 模型和材质蓝图
  14. ZYNQ学习之路5.扩展PL端串口
  15. office安装错误“错误25004,您输入的产品密钥无法在此计算机上使用,-----------”
  16. mac字体渲染精细处理
  17. 飞腾CPU体系结构(八)
  18. mysql 家谱关系_mysql – 家谱树算法
  19. 【独立篇】React UI组件库
  20. [OC学习笔记]块与大中枢开发

热门文章

  1. KeilC51使用详解 (三)
  2. 职业规划-服务器运维工程师(待完善)
  3. 雷达多普勒频率计算公式_详细分析:合成孔径雷达成像技术
  4. 量化交易----常见股票特征和编程实现
  5. 流式数据传输 php,PHP录制实时流式传输到文件
  6. autoreconf: command not found
  7. java中类何时被加载_java类在何时被加载
  8. 安卓zip解压软件_破解软件之“安卓压缩包zip或rar密码破解(116位数任意破)”...
  9. 压缩JPG图片大小而且不失真
  10. 做网站搭建服务器,个人服务器搭建做网站