©PaperWeekly 原创 · 作者 | 尹娟

学校 | 北京理工大学博士生

研究方向 | 随机过程、复杂网络单位

引言

该论文是关于深度学习理论性的文章,要知道深度神经网络经常会对样本分布之外的数据和对抗样本会出现不可预测性。在该论文中作者提出了一个几何梯度分析(GGA)来提高识别模型不可信的预测,该分析方法不需要重新训练给定的模型。基于神经网络各自输入的 来分析神经网络损失的几何特征。作者还提供了梯度的几何性质和损失函数的局部最小值之间的理论联系。

论文标题:

Identifying Untrustworthy Predictions in Neural Networks by Geometric Gradient Analysis

论文链接:

https://arxiv.org/abs/2102.12196

几何梯度分析

设 表示在一个监督分类任务中输入样本 及其对应的类标签 。用 表示由参数向量 参数化的神经网络,用 表示神经网络对给定样本  预测的类别。定义 为神经网络的损失函数。将 定义为给定样本 的第 类 表示为:

其中 表示符号函数。忽略对 的依赖性,对于给定的样本 ,余弦相似矩阵 被定义为:

其中 ,并且 表示 和 这两个 图之间的余弦相似度。与以前仅依赖于预测类别的显著性的方法相比,几何梯度分析考虑了所有可能的输出类别的 之间的几何属性。同时考虑多个 使得几何梯度攻击检测器更难被攻击。为了欺骗训练好的神经网络和几何梯度测器,攻击者必须在保留所有输出类别的 之间的几何属性中同时造成错误分类。

在神经网络训练成熟之后,正确分类的输入 大部分被映射到预测类别 的局部最小值中,对于这些正确分类的样本,非预测类 ,, 的 指向远离局部最小值的地方,并且呈现出高的平均余弦值。相反,错误分类的样本远离这些局部最优值的附近,并且对于不同的类别显示不同的 ,因此 的平均余弦相似性较低并且方差较大。

损失函数局部极小的充要条件:为了进一步推动神经网络输入空间中梯度几何的分析,作者引入了一个性质,能够识别给定的数据点是否位于损失中的局部极小值上。

定理1: 被定义为:

当且仅当:

点 在 的局部最小值中。

引理1:令 是一个 并且 是函数 的局部最小值点。则有:

证明:在 点进行泰勒展开,则有:

进一步化简可得:

如果 是局部最小值点,则有:

引理2:令 是一个 。对于所有的向量 有 ,则有:

证明:计算:

其中 表示是 的海森矩阵。因为 是一个 ,当 时, 收敛到 。

将引理1代入到 ,存在点 有 ,,则:

其中 ,因为 是连续的,则此时可知 。计算:

如果这个表达式对于收敛到 的所有 x 都是渐近非负的,对于任意的 ,有 ,定义 :

因为 是任意的,这意味着 是损失函数 的局部最小值。

实验设置

为了用 方法识别模型不可信的预测,首先为给定的样本   生成相应的 。然后从 中计算简单的特征,并使用它们来训练样本分布之外的点。对于给定的样本 ,假设 是与神经网络 类的下标索引。通过利用余弦相似矩阵 的对称性,并可以观察到该矩阵主对角线的元素都等于 。作者对两个不同的集合 和 计算五个基本特征,分别是平均值、最大值、最小值、标准偏差和能量,其中 。

作者使用基于 的有目标攻击来最大化随机目标类的损失,这种攻击可能导致所有其他类别的相似显著图,因为攻击将优化输入,使目标类别的损失达到局部最小值。作者利用均方误差和分类交叉熵损失来攻击。对所有目标攻击使用了相同的步长 和 100 次攻击迭代。作者添加余弦相似度目标来优化对抗扰动,使得所有非预测类 对齐。余弦相似度目标的损失由下式给出:

实验结果

如下表所示,在 ,,, 中对于不同 OOD 数据和对抗攻击中所有数值的真实阳性率为 95%。可以发现,论文中所提出的 GGA 方法对所有攻击都表现出较高的识别性能。

如下表所示,所提出的 方法对所有自适应攻击都表现出很高的识别性能。有目标的 PGD 攻击比无目标的 PGD 攻击成功率高。使用 交叉熵损失进行目标攻击更有效。通过余弦相似性攻击 ,可以成功地增加余弦相似性矩阵中非预测类之间的余弦相似性。

余弦相似度目标的权重越高,错误分类越少,反之亦然。 攻击只能导致分别对 、 和 数据集的 10000 个样本中的 561、1354 和 857 个样本进行错误分类。相比之下,无目标和有目标 攻击的成功率为 100%,导致所有数据集的 10000 幅图像全部被错误分类。

如下图所示,分类器的预测标签是彩色编码的,其中橙色的部分对应于真实类别,而蓝色的部分对应于对抗攻击后预测的类别。在决策边界附近,当不同类别的 之间的梯度方向开始发散时, 会发生特征波动。由此可以看出, 的平均值是分类器决策的稳定指标。

如下表所示为使用的相同的对抗攻击和异常数据的检测性能,这些数据仅使用前 个预测进行计算。可以发现即使只有5%的原始 用于计算 ,所有检测任务的性能也仅略微下降。可以观察到预测类别和非预测类别的梯度之间的余弦相似性对于检测不可信的预测来说是足够的。

更多阅读

#投 稿 通 道#

 让你的文字被更多人看到 

如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。

总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。

PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析科研心得竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。

???? 稿件基本要求:

• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注

• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题

• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算

???? 投稿通道:

• 投稿邮箱:hr@paperweekly.site

• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿

△长按添加PaperWeekly小编

????

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。

几何梯度分析神经网络中不可信预测性相关推荐

  1. 慕尼黑工业大学最新综述:深度神经网络中的不确定性

    ©PaperWeekly 原创 · 作者 | 王馨月 学校 | 四川大学本科生 研究方向 | 自然语言处理 概要 在过去的十年中,神经网络几乎遍及所有科学领域,并成为各种现实世界应用的重要组成部分.由 ...

  2. 机器学习中,什么是预测性维护,常见技术有哪些

    本文要点: 学习预测性维护系统(PMS),监控未来的系统故障并提前安排维护时间表 探讨如何构建机器学习模型进行系统的预测性维护 了解机器学习的处理步骤,如选择模型以及用Auto-Encoder技术去除 ...

  3. 微生物生态学中的挑战:建立对于群落功能与动态的预测性认识

    本文转自"微生太笔记",已获授权. 标题 Challenges in microbial ecology: building predictive understanding of ...

  4. matlab耀输,基于 Matlab的BP神经网络在太阳耀斑级别预测中的应用

    第 42卷 第 3期 2014年 5月 河南师范大学学报(自然科学版) Journal of Henan Normal University(Natural Science Edition) Z.42 ...

  5. 通过SCADA实现KPI分析和预测性维护远比想象中简单

    一.前言 随着工业发展的不断进步,越来越多的企业开始注重KPI分析和预测性维护.通过数据分析实现智能制造已经成为不可缺少的环节.制定并分析关键绩效指标(KPI)是实现数据分析战略的重要一步,因为只有跟 ...

  6. TDengine 在蓝深远望电机物联网监测预警与预测性维护平台中的应用

    作者:李凯 蓝深远望 小 T 导读:蓝深远望致力于服务政府及大型国有企事业单位的数字化转型,结合大数据.数字孪生.区块链.网络安全等核心技术,为政府运行.社会服务.城市管理.公共安全.基层治理等领域, ...

  7. 这些神经网络,还可信吗?

    转自 | Python专栏 神经网络被用的越来越多了. 无论是医疗诊断还是自动驾驶,在许多关乎人类安全与健康的重要领域,神经网络逐渐开始发挥作用. 但是这些神经网络,可信吗? 我们都知道,神经网络善于 ...

  8. 3D图像重建中的颜色预测误差研究

    目录 整体思路: 1.本课题的目的.意义 1. 描述图像 2. 标注图像 3.CNN 3D图像重建中的颜色预测误差研究 摘 要 1 绪 论 1.1背景与意义 1.2 课题研究内容 1.3 3D重建国内 ...

  9. Paper:《Distilling the Knowledge in a Neural Network神经网络中的知识蒸馏》翻译与解读

    Paper:<Distilling the Knowledge in a Neural Network神经网络中的知识蒸馏>翻译与解读 目录 <Distilling the Know ...

最新文章

  1. ResNet也能用在3D模型上了,清华「计图」团队新研究已开源
  2. java调用matlab 数组_JAVA调用matlab程序 输入输出数据转换
  3. Spring Boot配置嵌入式Servlet容器的两种方法
  4. python生成序列数(1-10)的立方列表_Python 4.3 创建数值列表(动手试一试)
  5. rac 火星舱如何备份oracle_Oracle数据库(RAC)巡检报告
  6. 7 款顶级开源 BI(商务智能)软件和报表工具
  7. 前端学习(1673):前端系列实战课程之最终封装
  8. day27 网络编程一
  9. Docker使用-构建MySQL
  10. C#LeetCode刷题之#671-二叉树中第二小的节点(Second Minimum Node In a Binary Tree)
  11. delphi 解析一维条码_科普帖:一般商用条码扫描器全知道,只需三把枪
  12. maven install 安装项目问题总结An unknown compilation problem occurred
  13. Linux 网络编程——UDP编程
  14. python常用模块之os
  15. 同步锁Synchronized和ReentrantLock区别
  16. vue.js 动态合并单元格问题
  17. linux安装Oracle11g详细教程(redhat6、Centos7)
  18. R语言学习day2丨三大法宝:判断、循环、函数
  19. 北京理工大学2000年复试上机题
  20. 中国古代十大杰出青年

热门文章

  1. java multivaluemap_java – 使用自定义值集合类型创建Commons Collections MultiValueMap
  2. 一个报文的路由器之旅_【NE探秘】一个报文的路由器之旅
  3. java 获取sqlsession_获取Java的MyBatis框架项目中的SqlSession的方法
  4. mysql 查询条件优先级_mysql条件查询and or使用实例及优先级介绍
  5. 三百行python代码的项目_使用300行代码创建一个分布式系统
  6. ArcGIS API for JavaScript 入门教程[5] 再讲数据——Map类之底图与高程
  7. Tomcat下使用war包发布项目
  8. HOWTO:如何在代码中获取安装包目标机上的Windows Installer(MSI)版本
  9. c语言编写服务器的优点,用C语言编写的服务器中记录效率最高的文件是什么?...
  10. phantomjs linux 中文不显示,linux 安装phantomJs 用于截图,处理中文乱码,和样式问题...