正规方程 Normal Equation

前几篇博客介绍了一些梯度下降的实用技巧,特征缩放(详见http://blog.csdn.net/u012328159/article/details/51030366)和学习率(详见http://blog.csdn.net/u012328159/article/details/51030961)。在线性回归中,为了求得参数的最优值,一般采用梯度下降和本文将要介绍的正规方程(normal equation)。相比较梯度下降采用多次迭代逼近的方式,normal equation采用矩阵运算可以直接求解出参数。先介绍下什么是normal equation,假设一个数据集X有m个样本,n个特征。则假设函数为: ,数据集X的特征向量表示为:
表示第i个训练样本,表示第i个训练样本的第j个特征。之所以在X中加了第一列全为1,是为了让,若希望假设函数能够拟合Y,则。又因为  ,所以可以通过矩阵运算求出参数
熟悉线性代数的同学应该知道怎么求出参数,但是前提是矩阵X存在逆矩阵。但只有方阵才有可能存在逆矩阵(不熟悉定理的同学建议去补补线性代数),因此可以通过左乘 使等式变成 ,因此,有同学可能会有疑问不一定存在啊,确实是,但是极少不存在,后面会介绍不存在的处理方法,先别着急。现在你只需要明白为什么就可以了,并且记住。
介绍完normal equation求解参数,我们已经知道了两种求解参数的方法,normal equation和梯度下降,现在来对比下这两种方法的优缺点以及什么场景选择什么方法。具体见下表吧:
回到上面说的不一定存在,这种情况是极少存在的。如果不可逆了,一般要考虑一下两者情况:
(1) 移除冗余特征,一些特征存在线性依赖。
(2) 特征太多时,要删除一些特征。例如(m<n),对于小样本数据使用正则化。

正规方程 Normal Equation相关推荐

  1. 关于线性回归:梯度下降和正规方程(gradient descend、normal equation)

    1.梯度下降法 假设: - x:输入特征 - y:样本标签,实际输出 - (x,y):训练样本 - m表示训练样本总数,loop:i - n表示特征总数,loop:j 目的是通过对训练样本进行学习,构 ...

  2. 【机器学习】线性回归之Normal Equation(矩阵求导与线性代数视角)

    Normal Equation 之前我们用梯度下降来求解线性回归问题的最优参数,除此之外我们还可以用正规方程法(Normal Equation)来求解其最优参数. Normal Equation方法的 ...

  3. Normal Equation 简介

    1. 什么是Normal Equation 在线性回归中,为了求得代价函数最小时的参数值θ.我们一般采用梯度下降法,但是当训练样本较小时(不超过千数量级)采用"Normal Equation ...

  4. 梯度下降算法与Normal equation

    Normal equation: Method to solve for θ analytically 正规方程:分析求解θ的方法 对于损失函数 \[J\left( {{\theta _0},{\th ...

  5. 用线性代数理解 Normal Equation

    在之前的博客中,我们通过矩阵求导的方式推导了 normal equation.这篇博客中,我们将通过线性代数的角度再次回顾 normal equation. Normal Equation 解决的问题 ...

  6. coursera机器学习笔记-多元线性回归,normal equation

    #对coursera上Andrew Ng老师开的机器学习课程的笔记和心得: #注:此笔记是我自己认为本节课里比较重要.难理解或容易忘记的内容并做了些补充,并非是课堂详细笔记和要点: #标记为<补 ...

  7. 正规方程法(Normal Equation)

    对于如下图中红框中的特征及其对应结果(房屋价格),添加一列特征值x0,构造成一个矩阵X 令Y为n维列向量:价格矩阵. 其最佳的θ向量可由下式计算得出: 其数学证明参考: 超定方程的最小二乘解 如果在使 ...

  8. 多元线性回归方程正规方程解(Normal Equation)公式推导详细过程

    多元线性方程公式 定义多元线性方程的损失函数如下: J(θ)=12m∑i=1m(y^(i)−y(i))2(1)J(\theta) = \frac{1}{2m}\sum_{i=1}^m (\hat{y} ...

  9. 标准方程法(normal equation)公式推导

    最近在看吴恩达的机器学习网课,讲到标准方程法的时候没有给出推导,在参考了两篇博客后推导出来了,记录一下. 机器学习之正规方程法推导 机器学习--线性回归中正规方程组的推导 两篇文章都给出了推导需要的基 ...

最新文章

  1. usaco Cowxor (trie 树)
  2. OpenGL ES 的例子
  3. Nginx 笔记与总结(15)nginx 实现反向代理 ( nginx + apache 动静分离)
  4. DL之PerceptronAdalineGD:基于iris莺尾花数据集利用Perceptron感知机和AdalineGD算法实现二分类
  5. 在R.java中新建自定义的新类
  6. WIN7系统共享访问方式总结
  7. dotNetCharting使用总结
  8. python 多线程 异步_python 多线程异步
  9. error: undefined reference to `PathTrace::PathTrace(World*)' (Codeblocks, C++)
  10. Spring Globle Transaction VS Local Transaction .
  11. c++计算一维数组中的最大元素
  12. Gauss数据库初识
  13. 企业微信【加入群聊】群活码十问十答
  14. 目前有哪些比较好的App流量变现的方法?
  15. py用barh绘制水平条形图
  16. 大V吐槽微信电脑版:视频、表情占满C盘
  17. 100个网络基础知识
  18. 整理了下这三天【面试】遇到的让人心惊胆颤的难题。
  19. 计算机硬件故障检测实验报告,计算机系统的硬件检测实验报告
  20. js数组中filter、map、reduce、find等方法实现的原理

热门文章

  1. 图片大小设置background-size
  2. CDR立体字效果制作详细教程
  3. P1319 压缩技术
  4. 如何做企业发布会直播/企业发布会直播流程
  5. 离开学校如何自学修炼成为一名网页设计师(一)
  6. 二分图匹配的 König定理
  7. 视频直播m3u8协议以及跨域问题和Videojs加载m3u8视频汇总
  8. 价值一个亿的AI核心代码(python)
  9. 计算机下记账凭证处理流程,第一节 电算化会计核算基本流程
  10. 环形链表(专题,带图示和思路)