1.1.1. Ordinary Least Squares

注:
本文所指线性回归,若非特别强调,均指最基础的线性回归模型

一、简介


线性模型的数学体现是:
y^=ω0+ω1x1+ω2x2+...+ωnxn\hat{y}=\omega_0+\omega_1x_1+\omega_2x_2+...+\omega_nx_ny^​=ω0​+ω1​x1​+ω2​x2​+...+ωn​xn​

首先要明确,我们的最终目的是要达到:对于给定的自变量vector x, 我们能根据已知的coef_vector ω\omegaω预测出最接近真实情况的y^\hat{y}y^​.

所以,在模型训练阶段,我们的需求是找到最合适的coef_使得预测值y^\hat{y}y^​与它的真实值y尽可能的接近。

二、应用

  • fit()拟合函数
  • coef_输出参数
  • predict()预测

三、多重共线性

1.文档

先看官方文档

下面这是翻译

2.解释

最后我们来解释一下这个所谓的多重共线性是个什么东西。

百度百科是这样解释的:

这个东西表达了什么?

  1. 它提到了一种让模型变得估计失真或难以估计准确的情况
  2. 这种情况是:变量之间存在精确相关性或高度相关关系

这种情况怎么理解?

就是当特征A与特征B高度相关,或者特征C可以由D和E线性表示时,我们稍稍调整A或D的值(例如存在某个离群点或者异常值),B和C也会相应的波动。这种波动在相似特征较多时会被放大,但是这种很大波动很可能只是一个异常值引起的,所以多重共线性最终会导致模型估计失真或难以估计准确

3.如何解决

  • 画热力图(协方差矩阵)选择特征进行训练(在特征数目较少的情况下)
  • PCA降维(1.降维后特征失去原本的语意;2.测试集和真实预测时也要降维)
  • 可以尝试Ridge regression(岭回归)来解决问题

四、线性回归的系数(非负)

这里介绍了一种情况,那就是当实际问题中参数均非负时,我们可以采用非负的最小二乘。当然,文档提供的事例证明了在系统限定系数下,NNLS要比OLS更好

五、时间复杂度

根据矩阵论中的奇异值分解,可以计算出,普通最小二乘的时间复杂度是O(nsamplesnfeatures2n_{samples}n_{features}^2nsamples​nfeatures2​)

1.1.1. Ordinary Least Squares(普通最小二乘)相关推荐

  1. Python 回归 普通最小二乘法(Ordinary Least Squares)

    广义线性回归模型: 把作为系数向量(coef_):把作为截距(intercept_) 1.普通最小二乘法(Ordinary Least Squares) 线性回归的目的就是是的预测值与实际值的残差平方 ...

  2. 线性回归模型-最小二乘法Ordinary Least Squares

    1.1 线性回归模型 下面是一系列的回归方法, 目标值是输入变量的线性组合, 定义y^\hat {y}y^​表示要预测的值. y^(w,x)=w0+w1x1+...+wpxp\hat {y}(w, x ...

  3. Ordinary least squares是什么意思?

    Ordinary Least Square是普通最小二乘法,简称OLS.是应用最多的参数估计方法,也是从最小二乘原理出发的其他估计方法的基础. 英语的解释: In statistics, ordina ...

  4. 线性回归(Linear Regression)和最小二乘法(ordinary least squares)

    下面是对Andrew Ng的CS229机器学习课程讲义note1做的一部分笔记,按照自己的理解,对note1进行部分翻译,英文水平和知识水平不够,很多认识都不够深刻或者正确,请大家不吝赐教! 一.基本 ...

  5. 最小二乘法(Ordinary Least Squares)

    最小二乘法(又称最小平方法)是一种数学优化技术.它通过最小化误差的平方和寻找数据的最佳函数匹配.利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小.最小二乘法 ...

  6. scikit-learn学习笔记(四)Ridge Regression ( 岭回归 )

    岭回归通过对系数的大小施加惩罚来解决 普通最小二乘 的一些问题. ridge coefficients ( 岭系数 )最小化了惩罚的残差平方和, 这里,  是控制收缩量的复杂度参数:  值越大,收缩量 ...

  7. ols最小二乘法是什么|OLS最小二乘法是如何推导的

    本站原创文章,转载请说明来自<老饼讲解-机器学习>ml.bbbdata.com <老饼讲解-机器学习>--一个免费.专业.全面的机器学习网站http://ml.bbbdata. ...

  8. 数据科学 专业词汇中英文对照表 1.0 v

    Stop words 停顿词 Substantive information 单词携带的信息量 Relational information 关系性信息 Normalization 标准化处理 Per ...

  9. mysql 多项式_多项式拟合和最小二乘问题

    背景知识 The method of least squares is a standard approach in regression analysis to the approximate so ...

最新文章

  1. 用自定义的RoundImageView来实现圆形图片(可加边框)
  2. 牛客网 栈的压入、弹出序列
  3. 数据更新播报php程序,使用thinkPHP实现数据更新一例【原创】
  4. java中 有没有方法将浏览器标签栏去掉_用JS去掉IE窗口的标题栏,工具栏,地址栏...
  5. 使用winform来递归实现资源管理器
  6. [html] 在HTML5中,用于获得用户的当前位置是哪个方法?
  7. 系统架构师学习笔记-数据通信与计算机网络(一)
  8. Spring Cloud Feign 启动报错 java.lang.ClassNotFoundException: org.springframework.cloud.client.loadbalan
  9. java int a=b指向_java里int a=3,给a赋值的时候,是给它3的地址,还是直接赋值二进制3?...
  10. opencv-python学习一--人脸检测
  11. 【2023年战略管理公开课计划】向华为学习 业务领先的战略规划SP(BLM)和战略解码BP(BEM)
  12. Python编程之求累乘和
  13. 【交互设计】手机上的跳转操作
  14. Android 显示历史搜索记录
  15. [来自iPc.me] 技术文,绝对是牛叉的技术文!把妹高手谈如何跟刚搭讪
  16. win10休眠_硬派玩家 | Win 10关机速度变慢?这还真不是错觉
  17. 2019.1.21【NOIP提高组】模拟B组 JZOJ 4208 线段树什么的最讨厌了
  18. 我怎么看技术人员去创业公司这件事
  19. 超级详细Ubuntu20.04.5系统下编译安装OpenCV with ffmpeg4.2.7、NVIDIA显卡驱动515、cuda11.5、cudnn8.3.3并编译使用darknet-yolov4
  20. 百度地图查询周围建筑

热门文章

  1. 写在Doris毕业后的第一天
  2. 老蒋谈建站不选择免费空间/主机的3个理由
  3. 都才40出头,近一个月已有至少5名优秀青年学者英年早逝!健康不容忽视
  4. 计算机音乐的感想,音乐教师工作心得体会(精选7篇)
  5. qmake:变量手册
  6. 一本超越期待的 C++ 书——简评《Boost程序库完全开发指南:深入C++“准”标准库》
  7. 微信小程序文件直接上传阿里云OSS
  8. vmware 安装 黑群晖
  9. python矩阵和向量乘积_矩阵与向量的乘积
  10. FTP主动模式(passive)和被动模式(port)的区别