本文简要介绍CVPR 2019 的Oral论文:Why ReLU Networks Yield High-Confidence Predictions Far Away From the Training Dataand How to Mitigate。该文章主要解决的问题是:在已知分布以外的样本上,神经网络预测结果的置信度过高。

开源代码:

https://github.com/max-andr/relu_networks_overconfident

一、研究背景

神经网络拟合能力极强。通常来说,提供足够多的训练样本,神经网络的鲁棒性能极大提高。然而,神经网络的鲁棒性提高了,也带来了风险。例如,将一个在CIFAR 10数据集(10类普通物体)上训练的神经网络,放到SVHN数据集(街景门牌)上做测试,该模型竟然能够以100%的置信度将门牌识别为狗、鸟和飞机等。这个现象引发了一个问题:神经网络的预测什么时候是可靠的,具体来讲,当这个样本在已知分布以外时,神经网络能不能以较低的置信度表示没有学习过这种样本,避免高置信度的错误预测?

图1.高置信度错误样本示例(图像来源:https://github.com/max-andr/relu_networks_overconfident)

二、主要贡献

这篇文章主要通过理论建模,解释ReLU带来的高置信度问题,并提出两种训练方式,即confidence enhancing data augmentation(CEDA)和adversarial confidence enhancingtraining (ACET),来缓解上述的不良情况。

三、基本理论

首先,作者先给出定义,什么是piecewise affine functions[1] :

这里的线性区域的显式上界已经在[2] 中讨论。与[3] 类似,带有ReLU的线性变换(如全连接层)可以写为:

作者引入两个对角矩阵:

则线性变换可以表示为:

为了进一步简化表示,作者将上述式子简写为:

其中,

四、高置信度问题

在解释ReLU带来的高置信度问题前,作者先给出引理:

紧接着是数值上的讨论:

上述的证明过程请见该论文的补充材料。

五、两种训练方式

作者提出了两种训练方式,一种是从数据层面来改善,例如攻击样本,另一种是在loss方程上的改进。两种方法的名称分别是confidence enhancingdata augmentation(CEDA)和adversarialconfidence enhancing training (ACET)。

数据增广CEDA上,每个batch加入λB张噪声图像,服从pout分布,这个做法类似[4] :

其中,

另一种ACET方法最小化下列的表达式:

其中,p设置为正无穷大,即与u差距最大的z起重要作用:

六、实验结果

作者在MNIST, SVHN, CIFAR-10 和CIFAR100上进行实验。在一个数据集上训练,在其余的数据集上测试,观察置信度的分布情况。实验发现,CEDA和ACET都能显著缓解本文开头阐述的问题,即神经网络对已知分布以外的样本置信度过高的问题。在CIFAR-100上,最好的指标均来自ACET方法。

为了进一步阐述该文章的效果,作者在项目主页上(https://github.com/max-andr/relu_networks_overconfident),给出了Two Moon Dataset上的二分类可视化结果。对于图2中红色和绿色两个半月形的训练样本,简单的分类器只会在两个类别中间画出N字型的低置信度区域。虽然模型并没有见过左上部分和右下部分的数据,但它仍然会在这一大片区域给出100%置信度的分类预测。

图2.简单的二分类模型的置信度

作者使用CEDA的方法训练模型,由图3能够得知,对于训练数据以外的大部分数据,模型都能给出比较低置信度的预测。

图3.基于CEDA的二分类模型的置信度

由于CEDA增加了额外训练样本,消耗更多训练时间,且对训练样本临近域的样本的甄别效果依然较差,所以作者使用ACET方法训练的模型,它的高置信度数据区域会更少,如图4所示。

图4.基于ACET的二分类模型的置信度

七、总结与讨论

本文提出了一个重要问题:带有ReLU的神经网络模型在已知分布以外的样本上置信度过高。这是一个需要权衡的问题,模型首先不能过拟合于训练集(overfitting),但是也不能对训练集以外的未知分布的样本过度自信(over confidence)。本文提出的CEDA和ACET通过挖掘训练集分布边缘的样本来提高模型对分布边缘的敏感度,抑制模型过度自信。这是一个很重要却少有学者思考的问题,该论文初步缓解了这个问题,也给未来更多的问题带来启发,例如少样本或零样本学习问题、类别分布不均匀(拖尾)问题等。

参考文献

[1] R. Arora, A.Basuy, P. Mianjyz, and A. Mukherjee.Understanding deep neural networks withrectified linear unit. In ICLR, 2018.

[2] G. Montufar, R.Pascanu, K. Cho, and Y. Bengio. On the number of linear regions of deep neuralnetworks. In NIPS, 2014.

[3] F. Croce and M.Hein. A randomized gradient-free attack on relu networks. In GCPR, 2018.

[4] D. Hendrycks, M.Mazeika, and T. Dietterich. Deep anomaly detection with outlier exposure. InICLR, 2019.

原文作者:Matthias Hein,Maksym Andriushchenko,Julian Bitterwolf

撰稿:罗灿杰/陈向乐

编排:高  学

审校:殷  飞

发布:金连文


免责声明:(1)本文仅代表撰稿者观点,个人理解及总结不一定准确及全面,论文完整思想及论点应以原论文为准。(2)本文观点不代表本公众号立场。


CV细分方向交流群

52CV已经建立多个CV专业交流群,包括:目标跟踪、目标检测、语义分割、姿态估计、人脸识别检测、医学影像处理、超分辨率、神经架构搜索、GAN、强化学习等,扫码添加CV君拉你入群,如已经为CV君其他账号好友请直接私信,

(请务必注明相关方向,比如:目标检测

喜欢在QQ交流的童鞋,可以加52CV官方QQ群:805388940。

(不会时时在线,如果没能及时通过验证还请见谅)


长按关注我爱计算机视觉

CVPR19 Oral 如何避免高置信度的错误预测?相关推荐

  1. CVPR2019:自动驾驶最新进展总结

    我们相信开发自动驾驶技术是我们这个时代最大的工程挑战之一,行业和研究团体之间的合作将扮演重要角色.由于这个原因,我们一直在通过参加学术会议,以及最近推出的自动驾驶数据集和基于语义地图的3D对象检测的K ...

  2. NVIDIA开源DG-Net:用GAN生成高质量行人图像,辅助行人重识别/在线试衣

    前几天英伟达开源了DG-Net的源码.让我们来回顾一下这篇CVPR19 Oral的论文. 论文是英伟达(NVIDIA), 悉尼科技大学(UTS), 澳大利亚国立大学(ANU)的研究人员 在CVPR19 ...

  3. 背景宽高随文本变化_中科大提出ContourNet:更准确的任意形状场景文本检测新方法...

    点击上方"CVer",选择加"星标"置顶 重磅干货,第一时间送达 本文转载自:CSIG文档图像分析与识别专委会 本文简要介绍2020年被CVPR录用的论文&qu ...

  4. RANet:MSDNet加强版!清华黄高团队提出分辨率自适应的高效推理网络RANet!

    关注公众号,发现CV技术之美 本文分享论文『Resolution Adaptive Networks for Efficient Inference』,由清华黄高团队提出分辨率自适应的高效推理网络RA ...

  5. 众包置信度:改进众包数据标记的贝叶斯推断

    Confident in the Crowd: Bayesian Inference to Improve Data Labelling in Crowdsourcing 作者 摘要 1 介绍 2 背 ...

  6. myBaits Expert Wheat Exome — 从多个小麦品种中富集超过250Mb的高可信度的外显子

    myBaits Expert Wheat Exome 与国际小麦基因组测序联盟(IWGSC)合作开发,使用了IWGSC发布的中国春基因组和注释信息.靶向六倍体小麦中完整的高置信度且有基因注释的外显子区 ...

  7. IIAI CVPR 2019 跟踪、检测、分割论文荐读

    点击我爱计算机视觉标星,更快获取CVML新技术 本文转载自起源人工智能研究院. 撰稿:Fahad Khan,孙国磊,廖胜才,卢宪凯 导语 CVPR (Conference on Computer Vi ...

  8. Mask Scoring R-CNN[详解]

    Mask Scoring R-CNN:Path Aggregation Network for Instance Segmentation(CVPR2019 oral) (消息来源: 性能超越何恺明M ...

  9. 一文看尽2019全年AI技术突破

    2020-01-29 11:45:29 边策 十三 鱼羊 发自 凹非寺量子位 报道 | 公众号 QbitAI 2019年,整个AI行业的发展如何? NLP模型不断刷新成绩,谷歌和Facebook你方唱 ...

最新文章

  1. 无监督特定类别的网格重建(U-CMR) | ECCV
  2. 那个每天半夜发加班朋友圈的程序员,你给我站住!
  3. SelectBox插件
  4. 台湾国立大学郭彦甫Matlab教程笔记(19)symbolic differentiation and integration
  5. 电脑打字学习_VOL.3,NO.2 | 小学一年级,爸爸管学习,完全就是个笑话!
  6. python逐个读取文件_在Python中多次读取同一文件
  7. Tomcat定义虚拟主机案例
  8. 循环序列模型 —— 1.8 带有神经网络的梯度消失
  9. 拦截器和过滤器区别_新手能看懂的(Interceptor)和(Filter)区别与使用!
  10. cygwin的安装使用
  11. c语言用三目运算符从小到大排列,错题集
  12. python程序设计基础
  13. Google android market 电子市场的安装 (for 1.6)
  14. 单元在整体坐标系下的刚度矩阵
  15. 南阳 oj 6174问题
  16. 笔记本电脑分区后怎么恢复?3个方法
  17. 让局域网网速极速狂飙(组图)
  18. minigui3.2 安装教程
  19. python基础之语言发展历史
  20. Linux chown -R 指令介绍与使用

热门文章

  1. Struts标签入门
  2. 微信小程序 - 实践- 001-实现一个多TAB的菜单框架
  3. java jdbc 批处理_Java JDBC批处理插入数据操作
  4. linux清缓存命令多节点,Liunx手动释放buffers/cache内存_linux,缓存,
  5. android webview capturepicture,android webView截图的4种方法
  6. linux 文件系统路径,Linux编程 1 (文件系统路径说明, 目录结构说明)
  7. java httpclient4_httpclient4使用说明
  8. 将更新面板的显示内容清除的代码实现;_免费开源:墨涩必应壁纸网盘系统1.0(自动壁纸更新免维护)
  9. lisp 设计盘形齿轮铣刀_用AutoLISP程序设计盘形齿轮铣刀渐开线齿形
  10. python获取他人的ip_Python获取指定网段正在使用的IP