来源:机器学习与数学

本文约7600字,建议阅读10+分钟。

Tensorflow 和 PyTorch 很多都是相似的,这里以 PyTorch 为例。

一、L1范数损失 L1Loss

计算 output 和 target 之差的绝对值。

torch.nn.L1Loss(reduction='mean')

参数:

  • reduction - 三个值:

    • none:不使用约简;

    • mean:返回loss和的平均值;

    • sum:返回loss的和。默认:mean。

二、均方误差损失 MSELoss

计算 output 和 target 之差的均方差。

torch.nn.MSELoss(reduction='mean')

参数:

  • reduction - 三个值:

    • none:不使用约简;

    • mean:返回loss和的平均值;

    • sum:返回loss的和。默认:mean。

三、交叉熵损失 CrossEntropyLoss

当训练有 C 个类别的分类问题时很有效。可选参数 weight 必须是一个1维Tensor,权重将被分配给各个类别。对于不平衡的训练集非常有效。

在多分类任务中,经常采用 softmax 激活函数+交叉熵损失函数,因为交叉熵描述了两个概率分布的差异,然而神经网络输出的是向量,并不是概率分布的形式。所以需要 softmax 激活函数将一个向量进行“归一化”成概率分布的形式,再采用交叉熵损失函数计算 loss。

torch.nn.CrossEntropyLoss(weight=None,ignore_index=-100, reduction='mean')
参数:
  • weight (Tensor, optional) – 自定义的每个类别的权重。必须是一个长度为 C 的 Tensor。

  • ignore_index (int, optional) – 设置一个目标值, 该目标值会被忽略, 从而不会影响到输入的梯度。

  • reduction - 三个值:

    • none:不使用约简;

    • mean:返回loss和的平均值;

    • sum:返回loss的和。默认:mean。

四、KL 散度损失 KLDivLoss

计算 input 和 target 之间的 KL 散度。KL 散度可用于衡量不同的连续分布之间的距离,在连续的输出分布的空间上(离散采样)上进行直接回归时很有效。

torch.nn.KLDivLoss(reduction='mean')

参数:

  • reduction - 三个值:

    • none:不使用约简;

    • mean:返回loss和的平均值;

    • sum:返回loss的和。默认:mean。

五、二进制交叉熵损失 BCELoss

二分类任务时的交叉熵计算函数。用于测量重构的误差,例如自动编码机。注意目标的值 t[i] 的范围为0到1之间。

torch.nn.BCELoss(weight=None, reduction='mean')

参数:

  • weight (Tensor, optional) – 自定义的每个 batch 元素的 loss 的权重。必须是一个长度为“nbatch”的Tensor。

  • reduction - 三个值:

    • none:不使用约简;

    • mean:返回loss和的平均值;

    • sum:返回loss的和。默认:mean。

六、BCEWithLogitsLoss

BCEWithLogitsLoss损失函数把 Sigmoid 层集成到了 BCELoss 类中。该版比用一个简单的 Sigmoid 层和 BCELoss 在数值上更稳定, 因为把这两个操作合并为一个层之后, 可以利用 log-sum-exp 的技巧来实现数值稳定。

torch.nn.BCEWithLogitsLoss(weight=None, reduction='mean', pos_weight=None)
参数:
  • weight (Tensor, optional) – 自定义的每个 batch 元素的 loss 的权重。必须是一个长度为 “nbatch”的Tensor。

  • reduction - 三个值:

    • none:不使用约简;

    • mean:返回loss和的平均值;

    • sum:返回loss的和。默认:mean。

七、MarginRankingLoss

torch.nn.MarginRankingLoss(margin=0.0, reduction='mean')
对于mini-batch(小批量)中每个实例的损失函数如下:参数:
  • margin:默认值0

  • reduction - 三个值:

    • none:不使用约简;

    • mean:返回loss和的平均值;

    • sum:返回loss的和。默认:mean。

八、HingeEmbeddingLoss

torch.nn.HingeEmbeddingLoss(margin=1.0,  reduction='mean')

对于 mini-batch(小批量) 中每个实例的损失函数如下:

参数:

  • margin:默认值1

  • reduction - 三个值:

    • none:不使用约简;

    • mean:返回loss和的平均值;

    • sum:返回loss的和。默认:mean。

九、多标签分类损失 MultiLabelMarginLoss

torch.nn.MultiLabelMarginLoss(reduction='mean')
对于mini-batch(小批量)中的每个样本按如下公式计算损失:

参数:

  • reduction - 三个值:

    • none:不使用约简;

    • mean:返回loss和的平均值;

    • sum:返回loss的和。默认:mean。

十、平滑版L1损失 SmoothL1Loss

也被称为 Huber 损失函数。

torch.nn.SmoothL1Loss(reduction='mean')

其中:

参数:

  • reduction - 三个值:

    • none:不使用约简;

    • mean:返回loss和的平均值;

    • sum:返回loss的和。默认:mean。

十一、2分类的logistic损失 SoftMarginLoss

torch.nn.SoftMarginLoss(reduction='mean')

参数:

  • reduction - 三个值:

    • none:不使用约简;

    • mean:返回loss和的平均值;

    • sum:返回loss的和。默认:mean。

十二、多标签 one-versus-all 损失 MultiLabelSoftMarginLoss

torch.nn.MultiLabelSoftMarginLoss(weight=None, reduction='mean')

参数:

  • reduction - 三个值:

    • none:不使用约简;

    • mean:返回loss和的平均值;

    • sum:返回loss的和。默认:mean。

十三、cosine 损失 CosineEmbeddingLoss

torch.nn.CosineEmbeddingLoss(margin=0.0, reduction='mean')

参数:
  • margin:默认值0

  • reduction - 三个值:

    • none:不使用约简;

    • mean:返回loss和的平均值;

    • sum:返回loss的和。默认:mean。

十四、多类别分类的hinge损失 MultiMarginLoss

torch.nn.MultiMarginLoss(p=1, margin=1.0, weight=None,  reduction='mean')

参数:
  • p=1或者2;默认值:1

  • margin:默认值:1

  • reduction - 三个值:

    • none:不使用约简;

    • mean:返回loss和的平均值;

    • sum:返回loss的和。默认:mean。

十五、三元组损失 TripletMarginLoss

和孪生网络相似,具体例子:给一个A,然后再给B、C,看看B、C谁和A更像。

torch.nn.TripletMarginLoss(margin=1.0, p=2.0, eps=1e-06, swap=False, reduction='mean')

其中:

参数:

  • reduction - 三个值:

    • none:不使用约简;

    • mean:返回loss和的平均值;

    • sum:返回loss的和。默认:mean。

十六、连接时序分类损失 CTCLoss

CTC连接时序分类损失,可以对没有对齐的数据进行自动对齐,主要用在没有事先对齐的序列化数据训练上。比如语音识别、ocr识别等等。

torch.nn.CTCLoss(blank=0, reduction='mean')

参数:

  • reduction - 三个值:

    • none:不使用约简;

    • mean:返回loss和的平均值;

    • sum:返回loss的和。默认:mean。

十七、负对数似然损失 NLLLoss

负对数似然损失。用于训练 C 个类别的分类问题。

torch.nn.NLLLoss(weight=None, ignore_index=-100,  reduction='mean')
参数:
  • weight(Tensor, optional) – 自定义的每个类别的权重。必须是一个长度为 C 的 Tensor。

  • ignore_index(int, optional) – 设置一个目标值,该目标值会被忽略,从而不会影响到输入的梯度。

  • reduction - 三个值:

    • none:不使用约简;

    • mean:返回loss和的平均值;

    • sum:返回loss的和。默认:mean。

十八、NLLLoss2d

对于图片输入的负对数似然损失。它计算每个像素的负对数似然损失。

torch.nn.NLLLoss2d(weight=None, ignore_index=-100, reduction='mean')
参数:
  • weight (Tensor, optional) – 自定义的每个类别的权重。必须是一个长度为 C 的Tensor。

  • reduction - 三个值:

    • none:不使用约简;

    • mean:返回loss和的平均值;

    • sum:返回loss的和。默认:mean。

十九、PoissonNLLLoss

目标值为泊松分布的负对数似然损失。

torch.nn.PoissonNLLLoss(log_input=True, full=False,  eps=1e-08,  reduction='mean')
参数:
  • log_input (bool, optional) – 如果设置为 True , loss 将会按照公式 exp(input) - target * input 来计算, 如果设置为 False , loss 将会按照 input - target * log(input+eps) 计算

  • full (bool, optional) – 是否计算全部的 loss, i. e. 加上 Stirling 近似项 target * log(target) - target + 0.5 * log(2 * pi * target)

  • eps (float, optional) – 默认值: 1e-8

  • reduction - 三个值:

    • none:不使用约简;

    • mean:返回loss和的平均值;

    • sum:返回loss的和。默认:mean。

仅作学术分享,若侵权请联系删除

作者:

mingo_敏

来源:

https://blog.csdn.net/shanglianlm/article/details/85019768

编辑:黄继彦

校对:杨学俊

收藏 | 深度学习损失函数大全相关推荐

  1. 收藏 | 深度学习损失函数大全(附代码实现)

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 来源:机器学习与数学 Tensorflow 和 PyTorch 很多都是相似的,这里以 PyT ...

  2. 深度学习损失函数大全

    深度学习损失函数大全 比focal loss好的GHM 常见损失函数汇总 - 知乎 有图展示,效果还可以: 激活函数/损失函数汇总 - 知乎 这个也不错: 损失函数汇总(全网最全) - WSX_199 ...

  3. 总结 | 深度学习损失函数大全

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文转自|计算机视觉联盟 tensorflow和pytorch很多 ...

  4. 跨年之际,中文版畅销书《TensorFlow深度学习实战大全》分享,直接送!

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 跨年之际,给大家一份福利,赠书抽奖,一共4本!感兴趣的同学可以参与一下,奖品是新书&l ...

  5. Github 上近万星的深度学习模型大全!

    点击我爱计算机视觉标星,更快获取CVML新技术 今天跟大家分享一个Github上的热门项目,深度学习模型大全: https://github.com/rasbt/deeplearning-models ...

  6. 新年快乐!这是份值得收藏的2017年AI与深度学习要点大全

    若朴 夏乙 编译自 WILDML 量子位 出品 | 公众号 QbitAI 2017已经正式离我们远去. 过去的一年里,有很多值得梳理记录的内容.博客WILDML的作者.曾在Google Brain做了 ...

  7. 收藏 | 深度学习调参有哪些技巧?

    点上方计算机视觉联盟获取更多干货 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:作者丨DOTA.永无止境.冯迁 来源丨知乎问答 编辑丨极市平台 AI博士笔记系列推荐 周志华<机器学习& ...

  8. c++ log函数_认识这19种深度学习损失函数,才能说你了解深度学习!

    编辑:深度学习自然语言处理小编zenRRan 损失函数是深度学习中重要的概念,选择合适的损失函数是系统能够得到理想结果的保证,本文将以pytorch工具为例,介绍这19中损失函数与实现方法. 19种损 ...

  9. 收藏 | 深度学习调试经验

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:作者丨土豆@知乎 来源丨https://zhuanlan.z ...

最新文章

  1. 攻城时服务器维护,8月31日服务器维护更新公告
  2. php文件上传漏洞waf,文件上传绕过WAF
  3. coreboot学习4:启动流程跟踪之romstage阶段
  4. 使用PADDING-TOP:(PERCENTAGE)实现响应式背景图片
  5. 考完试写一套新闻系统
  6. 图像像素点赋值_OpenCV学习笔记(二)之图像阈值化
  7. vue前端项目打包并且在服务器上部署过程
  8. android.util.typedvalue的jar包,android – 了解Typed值类
  9. Win 95 使用技巧
  10. 8.0高等数学五-斯托克斯公式
  11. 基于预测分析表法的语法分析程序
  12. Android媒体库你了解多少
  13. android如何暂停倒计时,Android计时器和倒计时的实现(含开始,暂停,和复位)...
  14. C++开源游戏推荐,reshade游戏画质增强工具
  15. TraceBack的用法
  16. 几个简单的数据点平滑处理算法
  17. spring源码编译导入eclipse
  18. OpenCV学习之利用背景建模检测运动物体
  19. python3 多表入库再优化
  20. http://www.52mybb.com/ 我爱我宝贝

热门文章

  1. 如何取消linux响铃_linux初学者入门:VIM编辑简易指南(常用操作)
  2. adc0832对光电二极管进行数据采集_实车采集的现场数据如何导入控制模型进行分析...
  3. 语音识别wav2letter++简介
  4. 随笔 - 141 文章 - 0 评论 - 214 IIS7 禁止目录运行脚本
  5. gulp将多张小图自动合成雪碧图
  6. 用buildout来构建python项目
  7. JS设计模式学习实例之单例模式
  8. netmon工作原理
  9. mybatis 取list第一个_MyBatis基础搭建及架构概述
  10. python next用法