线性回归:损失函数和假设函数

通过前面内容的介绍,我相信你对线性回归算法已经有了初步的认识。那我们应该如何在一大堆数据中求解出“线性方程呢”比如前面提及的房价预测问题?这种问题才是符合实际应用的。数据样本会散落在“线性方程”的周围(下图 2 所示), 而我们要做就是让线性方程的“直线”尽可能“拟合”周围的数据点。本节我们将从数学角度解析线性回归模型。

假设函数

通过前面知识的学习,我们知道假设函数是用来预测结果的。前面讲述时为了让大家更容易理解“线性回归”,我们以“直线方程”进行了类比讲解,然而线性方程并不等同于“直线方程”,线性方程描绘的是多维空间内的一条“直线”,并且每一个样本都会以向量数组的形式输入到函数中,因此假设函数也会发生一些许变化,函数表达式如下所示:

乍一看你可能蒙圈了,记住不用紧张。其实它和 Y=wX + b 是类似的,只不过我们这个标量公式换成了向量的形式。如果你已经学习了 《NumPy 教程》,那么这个公司很好理解,Y1仍然代表预测结果, X1表示数据样本, b表示用来调整预测结果的“偏差度量值”,而wT表示权值系数的转置。矩阵相乘法是一个求两个向量点积的过程,也就是按位相乘,然后求和,如下所示:

图1:矩阵乘法运算

矩阵 A 的每一行分别与矩阵 B 的每一列相乘,比如 15+25+37 =36 、12+26+36=32、16+27+3*4=32,即可得出结果的第一行数据。
转置操作的目的是为了保证第一个矩阵的列数(column)和第二个矩阵的行数(row)相同,只有这样才能做矩阵乘法运算。

您也可以将假设函数写成关于 x 的函述表达式,如下所示:

损失函数

我们知道,在线性回归模型中数据样本散落在线性方程的周围,如下图所示:

图2:线性回归模型

损失函数就像一个衡量尺,这个函数的返回值越大就表示预测结果与真实值偏差越大。其实计算单个样本的误差值非常简单,只需用预测值减去真实值即可:

单样本误差值 = Y1 - Y

但是上述方法只适用于二维平面的直线方程。在线性方程中,要更加复杂、严谨一些,因此我们采用数学中的“均方误差”公式来计算单样本误差:

公式是求“距离”因此要使用平方来消除负数,分母 2 代表样本的数量,这样就求得单样本误差值。当我们知道了单样本误差,那么总样本误差就非常好计算了:

最后,将假设函数带入上述损失函数就会得到一个关于 w 与 b 的损失函数(loss),如下所示:

在机器学习中使用损失函数的目的,是为了使用“优化方法”来求得最小的损失值,这样才能使预测值最逼近真实值。

在上述函数中 n、Y、X1 都是已知的,因此只需找到一组 w 与 b 使得上述函数取得最小值即可,这就转变成了数学上二次函数求极值的问题,而这个求极值的过程也就我们所说的“优化方法”。关于如何求极值会在下一节做详细介绍。

线性回归:损失函数和假设函数相关推荐

  1. 吴恩达机器学习(一)单变量线性回归(假设函数、代价函数、梯度下降)

    目录 0. 前言 1. 假设函数(Hypothesis) 2. 代价函数(Cost Function) 3. 梯度下降(Gradient Descent) 学习完吴恩达老师机器学习课程的单变量线性回归 ...

  2. 假设函数、损失函数、 成本函数

    基本概念 假设函数:假设函数用 hθ 表示,并且使用我们选择的模型.对于一个输入数据 x(i),模型预测输出为 hθ(x(i)) 损失函数:用 L 表示. 将对应于真实数据 y 的预测值 z(hθ) ...

  3. 损失函数和成本函数详解

    损失函数(误差函数) 概念:损失函数是再单个训练样本中定义的,该样本中可以有多个特征参数. 作用:可以用来衡量算法的运行情况,通过定义损失函数L来衡量预测值的输出y^~\hat{y}~ y^​ 和真实 ...

  4. 机器学习之——“损失函数”与“成本函数”的辨析

    机器学习之--"损失函数"与"成本函数"的辨析 损失函数与成本函数都表示预测结果与真实情况的偏差. 损失函数:是针对单个样本, 成本函数:针对整个数据集 成本函 ...

  5. 损失函数代价函数成本函数目标函数的区别

    损失函数&代价函数&成本函数&目标函数的区别 参考1:机器学习中的目标函数.损失函数.代价函数有什么区别? link: https://www.jianshu.com/p/dd ...

  6. Logistic回归模型及损失函数和成本函数

    Logistic回归模型.损失函数和成本函数 logistic模型 损失函数 成本函数 梯度下降法 logistic模型 logistic模型: y^=σ(wTx+b)\hat{y} = σ(w^Tx ...

  7. 神经网络-损失函数和成本函数

    每一篇神经网络算法入门可能会介绍神经网络的结构,以及值与值之间如何传递的,递归公式等.今天,我们在已学习神经网络基础知识的前提下,学习一下成本函数. 神经网络算法的逻辑递归函数: 我们的最终目的是为了 ...

  8. logit回归模型假设_机器学习基础---逻辑回归(假设函数与线性回归不同)

    一:分类 (一)分类基础 在分类问题中,你要预测的变量y是离散的值,我们将学习一种叫做逻辑回归 (Logistic Regression) 的算法,这是目前最流行使用最广泛的一种学习算法. 在分类问题 ...

  9. 线性回归损失函数为什么要用平方形式

    我们在前面的<线性回归>中了解到,对于训练数据样本(xi,yi)({x_i},{y_i}),我们有如下的拟合直线: yˆi=θ0+θ1∙xi {\widehat y_i} = {\thet ...

最新文章

  1. 2022-2028年中国硅酸钙板行业市场研究及前瞻分析报告
  2. Java归去来第2集:利用Eclipse创建Maven Web项目
  3. PHP实现简单的双色球机选号码
  4. mysql my.ini my.cnf_Mysql配置文件my.ini/my.cnf
  5. matlab常用工具箱的调用指令
  6. java实现单词或字符串反转
  7. 赶在 2018 年前推荐 30 个最火爆的开源库
  8. install-newton部署安装--------计算节点部署安装
  9. vue-router自动判断左右翻页转场动画
  10. 【SPPS学习一】 SPSS-26软件下载与安装步骤详解
  11. 【高频电子线路】[笔记]第1章 绪论
  12. 共享办公设备行业兴起,新宠“小熊U租”能否成为独角兽?
  13. MK808 vs Raspberry Pi
  14. tungsten mysql_ETL之Tungsten Replicator
  15. 下行法求最小割集案例_故障树分析方法(FTA)
  16. 【译】UI 的黑暗面!暗色背景的优势
  17. Android 修改zxing二维码样式
  18. 计算机专业硕士论文能编吗,论文发表:计算机硕士论文编数据被发现怎么办?.docx...
  19. 《单片机原理及应用(魏洪磊)》第六章第12题
  20. 牛客练习赛51c-勾股定理

热门文章

  1. 黑苹果不能使用无线网解决办法
  2. 《计算机工程》期刊 从投稿到录用过程
  3. Nginx静态资源站点——Nginx location作用
  4. matlab泰勒公式含义,泰勒公式的哲学意义与敏捷研发
  5. 什么是城市大脑 什么是智慧城市
  6. VHDL硬件描述语言(一)——基本结构
  7. 树莓派智能小车python论文_基于树莓派的自动驾驶小车,利用树莓派和tensorflow实现小车在赛道的自动驾驶...
  8. fastdfs-client使用
  9. 计算机同会计专业相结合的应用,现代信息科技在会计学专业教学应用实践.doc...
  10. 物流企业matlab效率,用MATLAB实现对周期趋向性物流需求的快速预测.PDF