最小二乘是求残差$e=Xw-y$的最大似然,也就是求最小-log似然。为简化问题,假设$e$是样本独立的nx1高斯分布,n是数据个数,$e$的nxn协方差矩阵$\Sigma_{ee}$是对角线矩阵,每个数据点在loss function中的权重是其残差的方差的倒数$1/var(e_i)$。换句话说,$e_i$方差越大,越不可信,其权重越小。而$e_i$方差的估计由实际问题的统计模型决定,我觉得是最小二乘框架中最重要,最体现对实际问题理解程度的地方。

$$\Sigma_{ee}=\begin{bmatrix} var(e_1) & & \\ & \ddots & \\ & & var(e_n) \end{bmatrix}$$

$$\Sigma_{ee}^{-1}=\begin{bmatrix} 1/var(e_1) & & \\ & \ddots & \\ & & 1/var(e_n) \end{bmatrix}$$

数据点加权的-logloss function是

$$-\log L(w)=(Xw-y)^T\Sigma_{ee}^{-1}(Xw-y)$$

因为$\Sigma_{ee}^{-1}$是对角线矩阵,有

$$-\log L(w)=\Sigma_{ee}^{-1}(Xw-y)^T(Xw-y)$$

其中$w$是待求参数,$X$是输入数据,$y$是输出,$\Sigma_{ee}$是输出的covariance matrix。每个数据对应的-logloss的权重是$1/var(e_i)$。

SofaSofa数据科学社区DS面试题库 DS面经

×

Warning

您确定要删除本贴么?所有相关回复也会被一并删除并且无法恢复。

取消

确定删除

Zealing

2018-10-02 18:42

python加权最小二乘_如何计算加权最小二乘法的样本权重?相关推荐

  1. python加权最小二乘_【Python】统计科学之加权最小二乘法

    首页 专栏 python 文章详情 0 统计科学之加权最小二乘法 张俊红发布于 今天 10:03 今天这篇来讲讲加权最小二乘法(WLS),加权最小二乘是在普通的最小二乘回归(OLS)的基础上进行改造的 ...

  2. python加权最小二乘_Eviews关于加权最小二乘法(WLS)中权重W的问题

    Eviews关于加权最小二乘法(WLS)中权重W的问题 使用Eviews7,多元线性模型中,怎么做进行加权最小二乘法啊?也就是WLS.权重W该怎么求呢?补充:我的变量数据有负数.请详细一点,好吗? 解 ...

  3. python加权最小二乘_【量化工具系列】Barra加权最小二乘的python实现

    BARRA USE4 page 13中写道,Factor returns in USE4 are estimated using weighted least-squares regression, ...

  4. python加权最小二乘_用Python实现最小二乘算法

    上一篇文章讲了最小二乘算法的原理.这篇文章通过一个简单的例子来看如何通过Python实现最小乘法的线性回归模型的参数估计. 王松桂老师<线性统计模型--线性回归与方差分析>一书中例3.1. ...

  5. python线性加权模型_局部加权之线性回归(1) - Python实现

    1 #局部加权线性回归 2 #交叉验证计算泛化误差最小点 3 4 5 importnumpy6 from matplotlib importpyplot as plt7 8 9 #待拟合不含噪声之目标 ...

  6. R语言作加权最小二乘_超越谷歌BERT!依图预训练语言理解模型入选NeurIPS

    机器之心发布 机器之心编辑部 在本文中,本土独角兽依图科技提出了一个小而美的方案--ConvBERT,通过全新的注意力模块,仅用 1/10 的训练时间和 1/6 的参数就获得了跟 BERT 模型一样的 ...

  7. R语言作加权最小二乘_作比较的句子 具有作比较说明方法的句子有哪些?

    不少人看到过象,都说象是很大的动物.其实还有比象大得多的动物,那就是鲸.[鲸] [没有美丽的外表,根本没人会去在意你美好的内心,这就是现实.] 松鼠的叫声很响亮,比黄鼠狼的叫声还有尖些.[松鼠] 松鼠 ...

  8. matlab 动态加权综合评价_动态加权综合评价方法.ppt

    动态加权综合评价方法 * * (3). 逼近理想点(TOPSIS)方法 4. 综合评价数学模型的建立方法 二.综合评价的一般方法 * * (3). 逼近理想点(TOPSIS)方法 4. 综合评价数学模 ...

  9. matlab 动态加权综合评价_动态加权综合评价、灰色关联度分析、BP神经网络模型汇总...

    大气污染预报问题 摘要 本文针对大气污染问题, 采用动态加权综合评价方法建立了合理的空气质量评价模 型,同时,采用灰色关联度分析方法和 BP 神经网络模型较好地研究了空气质量和气象 参数之间的关系. ...

最新文章

  1. 写得不错的几篇C/C++博客
  2. 计算机等级考试2018改革,2018全国计算机等级考试调整方案公布,这些科目取消了!...
  3. Vijos1451圆环取数[环形DP|区间DP]
  4. 介绍语义HTML5元素(感觉这个html5是一个不错的方向!)
  5. 分析拼多多的崛起【产品思维】
  6. Django模板系统 运算
  7. OpenCV3.4.3DNN 模块中sample-colorization、Easy-textdetector、openpose
  8. 地平线:发布线NavNet众包高精地图采集与定位方案,牵手韩国最大通讯企业 | CES 2019...
  9. 20155222 卢梓杰 myod
  10. SAP License:SAP 初学者指南
  11. 免密码自动登录远程服务器脚本
  12. php远程文件无法编辑,“脚本编辑器”远程文件编辑漏洞
  13. WEB安全基础理论笔记(幕布)
  14. 2.3,2.2,2.1最新谷歌服务包发布附下载(原创)
  15. 社会统计分析—基础知识
  16. 同义词转换不再有效_中考英语丨初中英语句型转换大全
  17. 递归,举几个简单的例子
  18. 创办6年未盈利,半年亏损40亿裁员25%,狂奔的滴滴怎么了?
  19. python numpy.arry, pytorch.Tensor及原生python中list相互转换
  20. 接入google 登录 google oauth2

热门文章

  1. 如何使用Markdown语言编写文档
  2. 2022.10.11
  3. [解疑][TI]TI毫米波雷达系列(三):调频连续波雷达回波信号3DFFT处理原理(测距、测速、测角)
  4. 基于Spring Boot的个人博客系统的设计与实现毕业设计源码271611
  5. 生日快乐 吉他谱-李雪莱
  6. 面试:微信和QQ的本质区别
  7. HTML进阶--段落标签P --------16岁的小前端
  8. 打印机一直不停打乱码的解决方法
  9. Numpy + Matplotlib 绘制白色画图
  10. html个人新闻网站,html,js,css实现