论文下载:Explaining and Harnessing Adversarial Examples

1摘要

几种机器学习模型,包括神经网络,一致地将对抗样本误分类——通过对数据集样本添加细微而刻意的扰动形成的输入,会导致模型以较高的置信度输出错误的结果。早期尝试解释这种现象时会专注于非线性和过拟合。但我们认为,造成神经网络在面对对抗扰动时的脆弱性的主要原因正是它们的线性特性。这种解释得到了新的定量结果的支持,对抗样本横跨网络结构和训练集的特点,也为这种解释提供了一个有趣的事实依据。此外,该观点产生了一种能够简单且快速地生成对抗扰动的方法。使用这种方法来提供样本进行对抗训练,能够降低Mnist 数据集上的Maxout网络的测试错误率。

2引言

Szegedy等人提出了一个有趣的发现:几种机器学习模型,甚至是SOTA网络,在面对对抗扰动时都是脆弱的。这也就是说对抗扰动暴露出了我们通常训练算法中的 盲点。
对抗样本的产生原因是个谜,有人认为是由于深度神经网络的极端非线性导致,甚至可能与纯粹的监督模型的正则化不充分有关。我们认为上述假设是不必要的,高维空间中的线性特性足够产生对抗样本。此观点给我们提供了一种能够快速生成对抗样本并进行对抗训练实践的方法。我们认为对抗训练产生的额外的正则化效果已经超出了仅用dropout带来的效果。

3对抗样本的线性解释

因为样本输入特征(input feature)的精度有限(一般图像的每个像素是8bits, 样本中所有低于1/255的信息都会被丢弃)(常见的数据图像大部分表示成1-255,8bit/像素点的形式,所以能够表示样本的精度十分有限),所以当样本x中每个元素值添加的扰动值η在小于样本输入特征精度时,分类器无法将样本x和对抗样本x˜=x+η区分开。也就是对一个分类良好的分类器而言,如果ε是一个足够小以至于被舍弃掉的值,那么只要
,分类器将认为x˜和x属于同一个类。下面考虑权重向量wT和对抗样本x˜的点积
可以看出,对抗扰动使得activation增加了wT·η,作者提出让η=sign(w)从而使wT·η最大化。假设权重向量w有n个维度,且权重向量中元素的平均量值是m,那么activation将增加ε·n·m。虽然η的无穷范数不会随着维度n的变化而变化,但是由η导致的activation的增加量ε·n·m会随着维度n线性增长。那么对于一个高维度的问题,一个样本中大量维度的无限小的干扰加在一起就可以对输出造成很大的变化。

所以对抗样本的线性解释表明,对线性模型而言,如果其输入样本有足够大的维度,那么线性模型也容易受到对抗样本的攻击。
以前的关于对抗样本的解释基于神经网络的假设属性,如高度非线性。我们的线性特性产生对抗样本的解释更简单,还可以解释为什么softmax回归易受对抗样本攻击的原因。

4非线性模型的线性扰动

对抗样本的线性解释介绍了一种快速生成对抗样本的方法。我们假设神经网络过于线性的性质使其不能抵抗对抗扰动。LSTMs,RELUs等算法为了便于优化,都故意设计为线性的方式。非线性模型如sigmoid等也出于同样的原因,花费大量时间在非饱和的时候进行线性设计。这些行为都应该对神经网络造成了破坏。

图中可以看出,通过往输入中加入与损失函数梯度的符号函数值相等的微小向量,能够改变神经网络对图片的分类结果。

θ是模型的参数,x是模型的输入,y为与x相关联的目标(对于具有目标的机器学习任务)和J(θ,x,y)是用于训练神经网络的损失函数。我们可以基于θ的当前值对损失函数进行线性化,获得η=α的最佳max-norm约束的扰动(∇x,J(θ,x,y))。

我们称这种生成对抗样本的方法为快速梯度符号法,其中需要的梯度可以通过反向传播来有效计算得到。
我们发现这种方法能可靠地使得各种模型误分类它们的输入。其他的生成对抗样本的方法还有,沿着梯度的方向将x旋转一个小角度,来生成对抗样本。
事实证明,这些简便生成对抗样本的方法能够作为证据支持我们关于对抗样本的线性解释。这些算法同样可以作为加速对抗训练和分析训练网络的有效方式。

5权重衰减线性模型的对抗训练



这里与L1正则化有些类似,但也有区别。最主要的就是这里L1惩罚项在训练期间要减去模型的激活,也就意味着如果模型学到的足够多的,乘法最终会消失。这个是不能保证发生的,欠拟合时,对抗训练会使得欠拟合情况更加严重。可以把L1权重衰减看做比对抗训练更糟的情况,因为模型并没能训练到足够好的情况。
回到多分类问题,L1权重衰减变得更加悲观,由于无法找到与所有类别权重向量对齐的η,它将每个softmax的输出都当做独立地扰动。权重衰减高估了扰动对含多个隐层单元的神经网络存在的损害。L1惩罚高估了对抗能造成的损害,所以有必要使用比与特征精度相关的ε更小的惩罚系数。更小的惩罚系数能够更好地训练,但没有带来正则化效果。

6深度网络对抗训练

我们发现使用基于快速梯度符号法的对抗目标函数训练是一种有效的正则方式

这种模型对于对抗样本有一定的抵抗力。

对抗攻击经典论文——FGSM学习笔记 EXPLAINING AND HARNESSING ADVERSARIAL EXAMPLES相关推荐

  1. 论文笔记——EXPLAINING AND HARNESSING ADVERSARIAL EXAMPLES(解释和利用对抗样本)

    本文参考了三篇笔记,帮助很大: <Explaining and Harnessing Adversarial Examples>阅读笔记 [论文笔记]Explaining & Ha ...

  2. EXPLAINING AND HARNESSING ADVERSARIAL EXAMPLES 论文笔记

    EXPLAINING AND HARNESSING ADVERSARIAL EXAMPLES 论文笔记 EXPLAINING AND HARNESSING ADVERSARIAL EXAMPLES 原 ...

  3. 对抗机器学习——FGSM经典论文 EXPLAINING AND HARNESSING ADVERSARIAL EXAMPLES

    EXPLAINING AND HARNESSING ADVERSARIAL EXAMPLES 论文URL http://users.wpi.edu/~kmus/ECE579M_files/Readin ...

  4. Explaining and Harnessing Adversarial Examples——论文的学习笔记01

    这篇文章由Goodfellow等人发表在ICLR'2015会议上,是对抗样本领域的经典论文.这篇文章主要提出与之前论文不同的线性假设来解释对抗样本的存在性.同时,论文提出了一种简单的对抗样本生成方法: ...

  5. explaining and harnessing adversarial examples(FGSM)

    explaining and harnessing adversarial examples(FGSM) 论文简述 论文重点 先前工作 对抗样本的线性解释 非线性模型的线性扰动 *线性模型的对抗扰动推 ...

  6. Explaining and Harnessing Adversarial Examples

    Explaining and Harnessing Adversarial Examples 包括神经网络在内的一些机器学习模型,始终对对抗性样本进行错误分类–通过对数据集中的例子应用小的但有意的最坏 ...

  7. 对抗攻击经典论文剖析(下)【DeepFool、One pixel attack、Universal adversarial perturbations、ATN】

    引言 上一篇讲的几篇经典对抗攻击论文主要讲的是如何在梯度上扰动或者优化,即尽可能保证下的扰动,不被人类发现,却大大降低了模型的性能.这一篇我们将会有一些更有意思的对抗攻击样本生成,包括像素级别的扰动以 ...

  8. 【论文阅读笔记】Explaining And Harnessing Adversarial Examples

    0.论文摘要 本文提出了对于对抗样本存在原因的新解释--神经网络的线性特性,并提出了快速有效生成对抗样本的方法以及基于对抗的模型训练方式. 1.对抗样本的线性解释 考虑如上公式,其中  代表一个生成的 ...

  9. 论文解读 | Explaining and Harnessing Adversarial Examples

    核心观点: 神经网络对于对抗样本的攻击如此脆弱的原因,是因为网络的线性本质. 文章还提出了最早的 FGSM (Fast Gradient Sigh Method)对抗样本生成方法. 通过在训练样本中加 ...

最新文章

  1. 正则表达式匹配多个字符(*、+、?、{m}、{m,n})
  2. php监听input,jQuery如何实时监听获取input输入框的值
  3. Sharepoint
  4. 发布管理——保证变更有序与有质的进行
  5. 获取用户坐标的html,html5获取用户地理位置
  6. c语言数据结构将链串里所有值为x的字符删除_redis数据结构与对象到底长什么样?...
  7. Resharper 和 Rider 的奇淫技巧,你知道多少?
  8. 25外观模式(Facade Pattern)
  9. 红帽linux64系统下载,红帽rhel6.5下载
  10. 2020 智慧旅游系统总体设计方案
  11. RCC BUCK变压器设计
  12. 【翻译】如何编写 Git 提交消息
  13. 我国IPTV研究目前已达到全球领先水平
  14. 全开源即时通讯(IM)系统 高仿微信
  15. Win系统 - 关于GPU,你需要长的“姿势”
  16. 电脑怎么还原系统win11
  17. 现实黑镜 | 面对死亡,你愿意将意识上传 获得“永生”吗?
  18. 避免卷入办公室政治-开发就是这么坑!
  19. Ubuntu应用推荐大全
  20. Dots Animation

热门文章

  1. Asset Pricing:Valuation
  2. C#使用List.Clear()方法可以让GC回收内存吗?
  3. dell服务器r730老自动重启_Re: DELL R730 服务器异常卡死导致iDRAC控制台无信号以及服务器远程连接失败重启后报内存错误(已插拔并已改变卡槽位置)...
  4. 基于cv2.VideoCapture 和 OpenCV 得到更快的 FPS之Webcam篇
  5. NAT(地址转换模式)
  6. EEPROM存储芯片24C02
  7. L1 distace、L2 distance,L1 norm、L2 norm,L1、L2范数
  8. 数据库系统概念 实验1~实验9
  9. 团队形成的阶段_误区39:团队自然形成,不必费心打造
  10. Java程序设计 北京大学 Week8测试