**

问题一:损失函数是什么?

**

损失函数就一个具体的样本而言,模型预测的值与真实值之间的差距。
哦哦,这句话怎么理解呢,就是我们使用自己的算法模型,然后就是自己的模型产生了一个自己进行判断出来的y(猜),然后我们放入模型进行训练的值就有一个y(真正),如何衡量我们模型产生的一个预测值和原本的值之间的差距呢,就是使用这个损失函数进行一个配对,让我们可以直观地看到机器学习的效果。

还有一种说法是:对于一个样本(xi,yi)其中yi为真实值,而f(xi)为我们的预测值。使用损失函数L(f(xi),yi)来表示真实值和预测值之间的差距。两者差距越小越好,最理想的情况是预测值刚好等于真实值。

**

下面来介绍一些主流的损失函数

**

L1 Loss损失函数

L1 Loss损失函数的优点与缺点

观察L1 Loss的图像如图下图所示:在图中我们可以看到的就是L1 Loss对于进行求导之后的线段是一个直线,因为我们可以联想提到的L1 Loss的损失函数公式,就能进行推导出来这个求导的线段。

pytorch实现:

x = torch.Tensor([1, 2, 3])
y = torch.Tensor([1, 0, 6])
L1loss = nn.L1Loss()
loss1 = L1loss(x, y)
print(loss1)

优点:

  1. L1 loss的鲁棒性(抗干扰性)比L2 loss强。概括起来就是L1对异常点不太敏感,而L2则会对异常点存在放大效果。因为L2将误差平方化,当误差大于1时,误会会放大很多,所以使用L2 loss的模型的误差会比使用L1 loss的模型对异常点更敏感。如果这个样本是一个异常值,模型就需要调整以适应单个的异常值,这会牺牲许多其它正常的样本,因为这些正常样本的误差比这单个的异常值的误差小。如果异常值对研究很重要,最小均方误差则是更好的选择。

缺点:

  1. L1 loss 对 x(损失值)的导数为常数,在训练后期,x较小时,若学习率不变,损失函数会在稳定值附近波动,很难收敛到更高的精度。
  2. L2 loss的稳定性比L1 loss好。概括起来就是对于新数据的调整,L1的变动很大,而L2的则整体变动不大。

L2 Loss损失函数

L2 Loss损失函数的图像如下:

缺点:

从L2 loss的图像可以看到,图像(上图左边红线)的每一点的导数都不一样的,离最低点越远,梯度越大,使用梯度下降法求解的时候梯度很大,可能导致梯度爆炸。

比如在深度学习的领域里面一般是不适用L1 Loss损失函数,一般使用L2Loss损失函数。

机器学习的L1、L2损失函数相关推荐

  1. [转] L1 L2范数

    作者:Andy Yang 链接:https://www.zhihu.com/question/26485586/answer/616029832 来源:知乎 著作权归作者所有.商业转载请联系作者获得授 ...

  2. 机器学习之L1、L2的区别与相关数学基础知识

    机器学习数学基础概念.知识汇总(线代) 数学概念 映射与函数 线性与非线性 空间 线性空间(向量空间) 向量 基 矩阵 范数 L-p范数 L-0范数 L-1范数 L-2范数 L-∞范数 机器学习中的正 ...

  3. L1 损失函数和 L2 损失函数

    L1 和 L2 是机器学习中的两个损失函数,用于最小化误差. L1 损失函数代表最小绝对偏差,也称为 LAD L2 损失函数代表最小二乘误差,也称为 LS 文章目录 一.L1 损失函数 二.L2 损失 ...

  4. L1、L2、smooth L1三类损失函数

    一.常见的MSE.MAE损失函数 1.1 均方误差.平方损失 均方误差(MSE)是回归损失函数中最常用的误差,它是预测值与目标值之间差值的平方和,其公式如下所示: 下图是均方根误差值的曲线分布,其中最 ...

  5. 机器学习基础-23:矩阵理论(L0/L1/L2范数等)

    机器学习基础-23:矩阵理论(L0/L1/L2范数等) 机器学习原理与实践(开源图书)-总目录,建议收藏,告别碎片阅读! 线性代数是数学的一个分支,广泛应用于科学和工程领域.线性代数和矩阵理论是机器学 ...

  6. 机器学习中L1正则化和L2正则化是什么?区别是什么?

    机器学习中L1正则化和L2正则化是什么?区别是什么? 我们所说的正则化,就是在原来的loss function的基础上,加上了一些正则化项或者称为模型复杂度惩罚项. 结构风险最小化: 在经验风险最小化 ...

  7. Lasso回归系列三:机器学习中的L0, L1, L2, L2,1范数

    L0, L1, L2, L2,1范数 机器学习中的范数定义不同于数学中的定义. 对于向量xxx (x=[x1,x2,x3,...xm]x=[x_1,x_2,x_3,... x_m]x=[x1​,x2​ ...

  8. 浅谈L0,L1,L2范数及其应用

    原文传送门:浅谈L0,L1,L2范数及其应用 浅谈L0,L1,L2范数及其应用 在线性代数,函数分析等数学分支中,范数(Norm)是一个函数,其赋予某个向量空间(或矩阵)中的每个向量以长度或大小.对于 ...

  9. 机器学习中常见的损失函数_机器学习中最常见的损失函数

    机器学习中常见的损失函数 现实世界中的DS (DS IN THE REAL WORLD) In mathematical optimization and decision theory, a los ...

最新文章

  1. 微信支付技术解决方案
  2. 德国艺术家用99部手机成功在Google地图上制造交通阻塞
  3. Recyclerview 出现 java.lang.IndexOutOfBoundsException: Inconsistency detected 异常
  4. redis/分布式文件存储系统/数据库 存储session,解决负载均衡集群中session不一致问题...
  5. 队列的基础概念与经典题目(Leetcode题解-Python语言)
  6. C++域作用符及其高级用法
  7. 设置SQLSERVER的错误日志数量和查找SQLSERVER安装错误日志
  8. pane Java_ToolPane.java
  9. Linux搭建邮件服务器postfix
  10. Chromium OS Autotest 概述
  11. 提高工作效率必备的生产力工具
  12. Flash动画设计交互式按钮
  13. 再获2亿元A+轮融资,乐生智能能否“扫出”舒适区?
  14. php 商品多规格的实现,sku实现
  15. (十九)深入理解蓝牙BLE之“低功耗蓝牙dongle”
  16. [global::]是什么形式?什么意思?
  17. vue集成capacitor
  18. 博文视点金秋新书大放送(1)
  19. python.plt 画三维图像
  20. Window 下 VFW 视频采集与显示

热门文章

  1. (面经)微信群发红包后,怎么判断抢的与发的钱数一致
  2. PDF阅读器开关“手型工具阅读文章”功能
  3. How to Reassign Workflow Task in Sharepoint 2007
  4. java求矩阵条件数_数值分析:矩阵求逆-奇异性、条件数
  5. centos 开发套件_替代的Laravel套件开发工作流程
  6. 微信公众号考试成绩查分系统
  7. CentOS 7 安装osquery监控系统
  8. web安全-文件上传(Js,MIME,文件头,黑白名单等校验)
  9. 解决“你的许可证不是正版,并且你可能是盗版软件的受害者。使用正版Office,避免干扰并保护你的文件安全。”
  10. 海德汉 LSV2 协议采集 2