背景介绍

提到label smoothing(标签平滑),首先介绍一下什么是hard label和soft label.
简单来说,hard label就是非1即0,不存在既可能是A也可能是B的情况,soft label则不同,它并不要求所有的“精力”全部倾向一个,允许模棱两可的状态,比如这幅画有40%的概率是猫, 60%的概率是狗。

什么时候会用到

标签平滑在机器学习或者深度学习中可以看作是一种正则化的技巧。它能提高分类任务中模型的泛化性能和准确率,缓解数据分布不平衡的问题。

为什么说能提高模型的泛化性能和准确率呢,我们需要从公式角度出发理解:

对于hard label的情况,softmax之后输出的结果为:

![在这里插入图片描述](https://img-blog.csdnimg.cn/978a0cc999![在这里插入图


可以看出,如果要想损失的loss为0,那么极限条件就是让正样本的输出值为1,负样本的输出值为0,而要想达到负样本的概率为0,则要求模型输出的logits值为负无穷,而正样本的输出值为常数。这种做法的弊端显而易见:
(1)当数据样本中有信息标注错误时,造成的后果就是一错再错,泛化能力特别差。
(2)一般模型中最后的输出值一般都是有界的,并且由于模型中会加入一些正则化的手段等,不可能 ,很难更新到理想的效果,在同等训练epoch条件下。

label smooth是在《Rethinking the inception architecture for computer vision》里面提出来的。可以设定超参数对label进行soft。


这里的负样本的softmax后的值为a,正负样本之间的差距只要达到

就可以认为达到理想的值,loss为0,相比hard label的无穷大的界限,这种方法的界限是有界的,更容易让模型学习到,同时由于存在其他信息,会使模型的泛化能力更加好。
所以,在损失函数为交叉熵的情况下,如果我们使用label-smooth编码,错误类的logit不会要求是负无穷。且错误类和正确类的logit值有一定大小误差的情况下,loss就会很小很小。

同时,可以看一下这张图,概率值达到一定值后,曲线变的越来越平缓,再优化很难更新。

综上,标签平滑可以产生相对较好的校准网络,从而更好的去泛化网络,最终用于对未知的数据进行预测。
【参考】
https://zhuanlan.zhihu.com/p/343807710

关于label smoothing的理解相关推荐

  1. 【正则化】Label Smoothing详解

    1. 概述 Label Smoothing(标签平滑),像 L1.L2 和 Dropout 一样,是一种正则化方法,通常用于分类问题,目的是防止模型在训练时过于自信地预测标签,改善泛化能力差的问题(也 ...

  2. 【AI面试】hard label与soft label,Label Smoothing Loss 和 Smooth L1 Loss

    往期文章: AI/CV面试,直达目录汇总 [AI面试]NMS 与 Soft NMS 的辨析 [AI面试]L1 loss.L2 loss和Smooth L1 Loss,L1正则化和L2正则化 在一次询问 ...

  3. 标签平滑论文笔记:2020《When Does Label Smoothing Help?》

    标签平滑 介绍 实验1:标签平滑作用 实验2:针对ECE与温度缩放进行对比(作用相近) 实验3:标签平滑对知识蒸馏影响(变差) 实验3知识蒸馏:互信息I(X;Y) 链接 介绍   看成距离:   这里 ...

  4. Label Smoothing分析

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 作者丨王峰@知乎 来源丨https://zhuanlan.zhih ...

  5. 标签平滑Label Smoothing

    Lable Smoothing 是分类问题中错误标注的一种解决方法. 对于分类问题,特别是多分类问题,常常把向量转换成one-hot-vector(独热向量) one-hot带来的问题:(对于独热的简 ...

  6. 模型优化之Label Smoothing

    1. 引言 Label Smoothing 又被称之为标签平滑,常常被用在分类网络中来作为防止过拟合的一种手段,整体方案简单易用,在小数据集上可以取得非常好的效果. Label Smoothing 做 ...

  7. When Does Label Smoothing Help?

    原文链接:When Does Label Smoothing Help? Hinton老师的这篇paper,解释了标签平滑策略在什么情况下是有效的? 摘要 通过从hard targets加权平均得到的 ...

  8. Label Smoothing标签平滑详解+Pytorch保姆级实际操作

    目录 简介 从提出Label Smoothing的论文出发 不使用LS时的情况 不使用LS时可能带来的问题 LS作为正则化的一种方式 具体操作 为何LS可以避免偏激的输出 对LS的另一个角度理解 Py ...

  9. label smoothing(标签平滑)

    label smoothing是一种在分类问题中,防止过拟合的方法. label smoothing(标签平滑) 交叉熵损失函数在多分类任务中存在的问题 label smoothing(标签平滑) 参 ...

最新文章

  1. 一图读懂:中国科学院“基础研究十条”
  2. php lang无效,详解 Go 中的不可变类型
  3. python根据地址查看变量名_tensorflow创建变量以及根据名称查找变量
  4. linux下编译ios,为iOS安装OpenCV
  5. Linux系统编程:简单实现ls -R 功能
  6. iOS开发——高级篇——iOS开发之网络安全密码学
  7. 9个元素换6次达到排序序列_面试题精选(排序算法类)c/c++版 上篇
  8. 1月29日以后需要做的事情
  9. day 21 模块 和 包
  10. HDUOJ---1233还是畅通工程
  11. 研究生数学建模竞赛准备
  12. 辉凌医药和维健医药就可利新达成战略合作
  13. 最适合入门的laravel初级教程(一)序言
  14. Python自动登录QQ空间
  15. 浅谈C++类中6个成员函数
  16. xml在线格式化工具
  17. 数据库修改表名,字段名 字段类型
  18. 比尔·盖茨向个人基金会捐赠200亿美元 已超此前承诺捐款数额
  19. 文件夹文件自动生成目录的方法-保存到txt
  20. 操作系统 外卖餐厅问题 PV 操作

热门文章

  1. 如何把自己的知识、经验、才华高效变现
  2. OpenSCAD中创建汉字几何造型
  3. 最简单的自定义视频播放进度条
  4. ​安装ns-3时候报错要求gcc版本高于7.00的问题解决​
  5. 爬虫系列教程二:如何获取网页信息并定位信息所处位置
  6. WebService它CXF这三个音符(Service接口实现类)
  7. java libpcap,Linux搭建jpcap libpcap环境
  8. Unity自定义ButtonGroup类
  9. 图片批量合成视频,并自动生成封面和配乐
  10. 计算机科学游戏化,智慧教育学院(计算机科学与技术学院)“智慧讲堂”学术讲座系列第六十九讲 ——尚俊杰研究员《基于学习科学视角的游戏化学习研究》...