前言废话

    前面讲了线性回归分析,从观测数据中确定线性回归的模型的方法就是最小二乘法。即

使得上面的均方误差和最小。(关于为什么,请参照以下博客)
如何理解最小二乘法?
本文将主要分析最小二乘法的具体解法。

关于最小二乘法的解法,一般由以下解法:
1、多元函数求最值(也有的说法把这当成最小二乘法)
2、利用线代的几何意义
3、梯度下降法

一、多元函数求最值

从本质上来说,上述均方误差和就是一个关于参数(a,b)的多元函数。如下图所示:

这里的f(xi)是线性回归模型ax+b。
对于多元函数来说,求其最小值,我们可以利用高等数学中多元函数求偏导的方式。即

解上述方程,就可以得到最终的β0,β1解。如下所示。(有凸函数理论可以证明,对于线性回归来说,其均方误差是有最小值,此处求得的β0,β1解就是其全局最优解,但是这条理论对其他回归模型可能不成立)。

多元线性回归模型求解同理。

二、利用线代的几何意义

对于线性回归问题,我们可以换一个思路。即观测到一系列数据点,而这些数据点需要都在一条直线方程上。我们利用线性代数中解线性方程组的方式来解释最小二乘法。
为了简单叙述,
以y=cX1+dX2这个二元线性方程为例。(其中c、d是参数,X1,X2为自变量)

如题:观测到数据点(4 -1 5)、(2 2 10)、(0 0 1). 其中前两个是自变量X1、X2,最后一个是因变量y。
需要是上述数据点符合二元线性方程。即

成立。
上述方程称为超定方程组,这种方程组并没有精确解(c、d)。我们需要需要求得一个近似解。

由线性代数的知识可以知道,上述方程组问题可以看成以下两个向量w、v的线性组合是否可以组合成b向量(此处应该是更好的写法应该是转置,但是比较难打,敬请见谅)

此时,向量w和v都在xy平面上,所以w、v的线性组合决不能跑到xy平面。而由于向量b的第三个值为1,它脱离了xy平面,所以此此w、v的线性组合是无法成为b向量的。这也验证了上述线性方程组无解的情况。如下图所示。

我们现在不要求w、v的合成向量

准确等于b,只希望使bb尽可能的接近b。我们知道,bb的可取范围是整个xy平面(w和v所有线性组合的平面),其中哪一点与向量b的矢量端最接近呢?应该是从b端向wv平面做垂线的垂足。此时两者的误差e就是垂线的长度,它也是平面上所有可能的bb中与b最小的误差。
那么如何确定e呢?很简单,确定向量e的条件就是它与v和w都正交,即

(好吧,我承认这是《使用大众线性代数》里面的内容,我不想手打了。我还没吃饭呢。┭┮﹏┭┮)

这里要说明一点,利用多元函数求最值和这里线代的几何意义求得的最值本质上是相同的。只需把前者的过程化成矩阵的形式即可。

三、梯度下降法

所谓梯度下降法,是迭代法计算最值的一种形式。是通过不断求导改变待求参数的值,来达到不断求得最值的过程。


如上图所示,可以把这里的J(x,y)当成我们讨论的均方误差和。(其实这里J(x,y)是机器学习中的代价函数)
α是下降速度,可以根据现实情况选择(机器学习中时也叫做学习速率)。
对于一元线性回归来说就是下面这张图。

一般来说,梯度下降法可能会下降到局部最优点,但是对于线性回归来说其均方差函数大概是下面这个样子。

所以局部最优就是全局最优了。
这种算法不是这里的重点,值简要介绍到这儿。具体的其他性质,请自行查阅。

四、一个小实验

最后上一个用matlab做的一个小实验,进行线性回归的实验。

clear;
clc;data_mat  = load('ex0.txt');%从ex0.txt文本文件中读取数据
x = data_mat(:,2);  %获取第二列数据,作为输入
y = data_mat(:,3);  %获取第三列数据,作为输出
X = [data_mat(:,1:2)];%取出m行2列的系数矩阵,其中第一列全为1w = pinv(A)*y;%计算获得回归参数a,b。其中pinv为伪逆函数%构造数据,画出散点图和拟合图像
x1 = linspace(0,1,20);
y1 = w(1)*x1+w(2);
scatter(x,y),hold on, plot(x1,y1)

效果如下图所示:

具体的数据和代码已经上传到对应的资源页了。

数学模型之最小二乘法相关推荐

  1. 最小二乘法的本质是什么?

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文转自:深度学习与计算机视觉 作者:梨梨喵 https://ww ...

  2. matlab最小二乘法参数辨识,基于最小二乘法的MATLAB辨识仿真实验

    <工业控制计算机>2013 年第 26 卷第 7 期基于最小二乘法的 MATLAB 辨识仿真实验 崔秀美 刘文杰 陈 澄 (苏州大学机电工程学院,江苏 苏州 215021) Experim ...

  3. 自适应滤波:最小二乘法

    作者:桂. 时间:2017-04-04  08:13:14 链接:http://www.cnblogs.com/xingshansi/p/6664288.html 声明:欢迎被转载,不过记得注明出处哦 ...

  4. 最小二乘法以及RANSAC(随机采样一致性)思想及实现

    线性回归–最小二乘法(Least Square Method) 线性回归: 什么是线性回归? 举个例子,某商品的利润在售价为2元.5元.10元时分别为4元.10元.20元, 我们很容易得出商品的利润与 ...

  5. matlab最小二乘法_基于最小二乘法的线性回归拟合

    阅读本文需要的知识储备: 高等数学 概率论与数理统计 Python基础 线性回归,其实生活中有很多这样的例子,比如:票价与行车距离.服务质量之间的关系,买房时房价与面积.地域等的关系.给我们一组这样的 ...

  6. matlab非线性系统频域标识,基于MATLAB的最小二乘法系统辨识与仿真

    第 29卷 第 2期 许昌学院学报 Vol. 29. No. 2 2010年 3月 JOURNAL OF XUCHANG UN IVERSITY Mar. 2010 收稿日期: 2008 - 10 - ...

  7. 正态分布的前世今生:最小二乘法

    转载自:http://www.itongji.cn/article/110Q3352012.html [编者注]几乎所有的经济模型都有假设前提,学过计量经济学的同学都知道古典假设,而正态分布又在假设中 ...

  8. 系统辨识(六):最小二乘法的修正算法

    最小二乘法的修正算法主要包括: 广义最小二乘法(Generalized Least Squares Method,简称GLS) 辅助变量法(Instrumental Variable Method,简 ...

  9. 递推最小二乘法RLS的轮胎侧偏刚度估计(原书缺失代码已补全)

    目录 1 参数辨识 1.1 最小二乘法 1.2 递推最小二乘法 RLS 1.3 具有遗忘因子 λ 的递推最小二乘法 2 轮胎线性侧偏刚度估计 2.1 RLS 算法分析 2.2 联合仿真平台的设计 ca ...

  10. 电池SOC仿真系列-基于遗忘因子的最小二乘法电池参数辨识(二阶RC)

    基于遗忘因子的最小二乘法电池参数辨识   最小二乘法是系统辨识中最常用的一种估算方法.为了克服最小二乘法存在"数据饱和"的问题,我们通常采用含有遗忘因子的递推最小二乘法(Forge ...

最新文章

  1. centos7上的图形化界面svn客户端_Git实战一:图形客户端规范用法小讲
  2. Curl 采集乱码 gzip 原因及解决方案 utf-8
  3. ML之LoRBaggingRF:依次利用Bagging、RF算法对泰坦尼克号数据集 (Kaggle经典案例)获救人员进行二分类预测——模型融合
  4. Oracle数据文件的备份与恢复
  5. ”易书网“开发总结——管理篇
  6. 做底层 AI 框架和做上层 AI 应用,哪个对自己的学术水平(或综合能力)促进更大?...
  7. hive表加载数据的不同方式
  8. 2022百度之星程序设计大赛 - 复赛 1003 最大值
  9. Scratch 怪兽动画+骨骼矢量素材编程素材免费下载!
  10. 业务安全之接口调用安全
  11. 销售额预测_机器学习
  12. 21届校招中获得12家公司offer的一些经验(包括6家银行信息科技岗offer)
  13. 骷髅创意设计灵感_20种创意旅行应用程序设计,激发您的灵感
  14. dpdk介绍系列之ring
  15. excel 查询 表关联_从Excel查询表获取里程
  16. 2.1安装前的准备工作---安装Red Hat Linux
  17. 机器视觉——光源介绍
  18. 可变滤波效果器-Pulsar Modular P565 Filter Set v1.2.0 macOS-MORiA
  19. 华为诺亚方舟实验室多项强化学习研究成果获IJCAI 2020录用
  20. 关于java.sql.SQLException: No suitable driver found for jdbc:mysql:

热门文章

  1. Excel怎么制作三斜线表头
  2. 《众妙之门——用户体验设计的秘密》一第2章 设计“好脾气”的网页2.1 巴赫和他的十二平均律...
  3. ubuntu文件夹加密_安装Ubuntu后如何加密您的主文件夹
  4. 华北电力计算机类哪个专业好,华北电力和北京化工的计算机专业那个好?
  5. 硬盘安装Win7全攻略(图解)
  6. Excel:文本数字转换成数字的三种方法(转)
  7. Large-Scale Order Dispatch in On-Demand Ride-Hailing Platforms: A Learning and Planning Approach论文精读
  8. Ubuntu 搭建强大的 IDE —— Vim + Vundle + 插件
  9. 犹太民族与基督的真相!
  10. 金蝶K3wise 演示版 W10安装