线性最小二乘法的通俗理解

  • 1. 最小二乘法
  • 2. 通俗理解
    • 2.1. 举例
    • 2.2. 线性方程组
    • 2.3. 最优猜测
    • 2.4. 求偏导

1. 最小二乘法

最小二乘法(又称最小平方法)是一种数学优化技术
它通过 最小化误差的平方和 寻找数据的最佳函数匹配

利用最小二乘法可以简便地求得未知的数据
并使得这些求得的数据与实际数据之间误差的平方和为最小

最小二乘法还可用于曲线拟合
其他一些优化问题也可通过 最小化能量最大化熵 用最小二乘法来表达


2. 通俗理解


2.1. 举例

这里举个简单的例子吧
假如去食堂打包,不同的菜价格不一样:

  • 打包 1个菜需要 8 块
  • 打包 2个菜需要 11 块
  • 打包 3个菜需要 18 块
  • 打包 4个菜需要 21 块

那么打包5个菜需要多少块


2.2. 线性方程组

一般应该会想到用线性方程组来解决这个问题:

假定 x 是菜式的数量,y是付款金额,β1和β2为未知的系数
把上面的一组数据代入,得到以下四个方程:

但这样的β1和β2是不存在的

形象地说,它们不在一条直线上

可是现实中,就希望能找到一条直线
虽然不能满足所有条件,但能近似地表示这个趋势
或者说,能大概猜测出打包5个菜的价格


2.3. 最优猜测

其实最小二乘法也是这样,要尽全力 让这条直线最接近这些点
那么问题来了,怎么去做一个标准,即 怎么去定义这个最接近 呢?

直觉告诉我们,这条直线在所有数据点中间穿过,让这些点到这条直线的误差之和越小越好
这里用方差来算更客观,即把每个点到直线的 误差平方累加

如果上面的四个方程都能满足,那么S的值显然为0
但如果做不到,就让应该这个S越小越好


2.4. 求偏导

这里有一个概念,就是求 偏导数,需要了解一下
比如导数就是求变化率
而偏导数则是当变量超过一个的时候,对 其中一个变量 求变化率

要让S取得最小值(或最大值),那么S对于β1和β2分别求偏导结果为0
用一个直观的图来表示:

这条曲线,前半部分是呈下降的趋势,也就是变化率(导数)为负的
后半部分呈上升的趋势,也就是变化率(导数)为正
那么分界点的导数为0,也就是取得最小值的地方

这是一个变量的情况,对于多个变量的情况,要让S取得最小值
那就是对β1和β2分别求导,值为0:

两个变量,刚好有两个方程式,得出:

即:

这个函数也就是需要的直线
虽然不能把那些点串起来,但它能最大程度上接近这些点
也就是说5个菜的时候,大概为 3 + 4.6 x 5 = 26 块

这是对最优问题的情况,类似神经网络也很多采用这种方式
虽然这种方法有局限性但还是很常见的


谢谢!

线性最小二乘法的通俗理解相关推荐

  1. 拉格朗日乘子法的通俗理解

    拉格朗日乘子法的通俗理解 1. 举例 2. 求偏导 3. 拉格朗日乘子法 4. 乘子 1. 举例 这里举个简单的例子吧 在家里做蛋糕,假如只计算鸡蛋和牛奶的价格 其中鸡蛋的价格为4.5¥/斤,牛奶为1 ...

  2. 线代学习笔记(一)——线性代数的通俗理解

    线性代数通俗理解 本篇笔记内容主要来源于45分钟线性代数通俗讲解_哔哩哔哩_bilibili,非常感谢up主的分享,这里我加入了部分自己的理解,与自己所学的知识结合完成. 基础概念 数据的维度:即数据 ...

  3. 通俗理解卡尔曼滤波(无人驾驶感知融合的经典算法)

    前言 我个人有近10年AI教育经验了,中间获得过一些名号,比如北理工校外导师,微软MVP兼CSDN技术专家,本博客也有1700多万PV了,在AI圈内有极高知名度.后2015年和团队一块创业创办AI职教 ...

  4. CNN笔记:通俗理解卷积神经网络

    通俗理解卷积神经网络(cs231n与5月dl班课程笔记) http://blog.csdn.net/v_july_v/article/details/51812459 1 前言 2012年我在北京组织 ...

  5. 【干货】通俗理解神经网络中激活函数作用

    推荐阅读时间8min~13min 主要内容:通俗理解激活函数,主要来自我在学习会的slides,讲解了激活函数的非线性能力和组合特征的作用 下面我分别对激活函数的两个作用进行解释. 1 加入非线性因素 ...

  6. LDA通俗理解LDA主题模型

    转自:http://blog.csdn.net/v_july_v/article/details/41209515#t13 通俗理解LDA主题模型 0 前言 印象中,最开始听说"LDA&qu ...

  7. 如何通俗理解Word2Vec

    如何通俗理解Word2Vec 看本文之前,建议先看此文:<BERT通俗笔记:从Word2Vec/Transformer逐步理解到BERT> 前言 今年上半年,我在我的上一篇LSTM博客中写 ...

  8. AI绘画能力的起源:通俗理解VAE、扩散模型DDPM、DETR、ViT/Swin transformer

    前言 2018年我写过一篇博客,叫:<一文读懂目标检测:R-CNN.Fast R-CNN.Faster R-CNN.YOLO.SSD>,该文相当于梳理了2019年之前CV领域的典型视觉模型 ...

  9. 通俗理解LDA主题模型(转载自 v_JULY_v 大佬)

    通俗理解LDA主题模型 原文:https://blog.csdn.net/v_july_v/article/details/41209515 0 前言 印象中,最开始听说"LDA" ...

最新文章

  1. 卧槽,又一个Java面试神器!!!
  2. 数据产品经理从零到一:数据产品能力模型构建
  3. PaddlePaddle训练营——公开课——AI核心技术掌握——第2章机器能“看”的现代技术——源自视觉神经原理的卷积网络简介及深入理解
  4. 在看世界杯的闲暇看看电视剧《长恨歌》
  5. C#种将String类型转换成int型
  6. python 柱形图_Python 写入 Excel III 详解图形生成-柱形图
  7. CSS权威指南 -- 第一章 CSS和文档
  8. 最详细的制作正式版10.11 OS X El Capitan 安装U盘的方法
  9. 计算机组成原理(动态随机存储器)
  10. 搜狗输入法不能再idea上输入中文
  11. 【补丁】YYC松鼠短视频系统补丁,增加视频点赞数据管理功能,可修改点赞数量,V2.8的功能
  12. NVIDIA SPADE 风景合成
  13. PCB板设计布局原则有哪些?
  14. 黑马旅游网-旅游分类线路分页显示(七)
  15. 纯干货!埃森哲的大数据分析框架分享-part 1
  16. Iterator循环的用法
  17. 成功解决:RuntimeError: implement_array_function method already has a docstring
  18. virtualBox 虚拟机安装Windows7系统
  19. EMC设计的四大技巧
  20. lcd屏和amoled屏的优缺点 lcd屏和amoled屏哪个效果好

热门文章

  1. startx启动过程分析
  2. 网络编程中使用float型数据要注意
  3. 利用SMS实现资产管理
  4. 原来Queryable是这样实现的..
  5. JDK源码(14)-Error、Exception
  6. 程序员的进阶课-架构师之路(8)-二叉树
  7. Coding and Paper Letter(四十)
  8. 好戏连台,BCH独领风骚
  9. Android Day05-网络编程之文件下载之多线程断点续传技术
  10. React Native商城项目实战04 - 封装TabNavigator.Item的创建