论文: http://proceedings.mlr.press/v80/karmon18a/karmon18a.pdf
(该论文代码未开源)

Motivation

  这篇paper聚焦于基于patch的对抗攻击,过去的对抗攻击主要是基于LpL_{p}Lp​约束,即将噪声添加在整幅图像上,同时限制噪声的大小满足∣δ∣<Lp|\delta| <\,L_{p}∣δ∣<Lp​,从而保证噪声难以被人眼所察觉。但是由于施加在整图的噪声难以进行打印,同时噪声量较小很容易受到环境影响,因此LpL_{p}Lp​攻击难以引入到现实应用中。而基于patch的攻击将噪声施加在图像中一个闭合的局部区域内,但是对噪声的大小不加太大的限制。Brown等人有一篇相似的工作,主要是通过3D打印的方式将攻击patch打印并贴在图像上,从而在现实场景下实现对抗攻击。但是为了保证在现实场景中的攻击泛化性,生成的patch在90%的场景下,至少要占据图像10%的面积才能攻击成功,如果需要使得攻击的patch不易被察觉,则至少要占据35%的面积。而本文的工作不考虑引入到现实应用场景,主要聚焦于数字领域。

Contribution

  本文提出了一种基于patch的对抗攻击算法,生成的攻击patch只占据图像不到2%的面积,并且不遮挡任何关键的目标区域,同时保证极高的攻击成功率。本文的核心贡献是patch对于图像以及位置的universal属性,即一次生成的攻击patch可以放置在任意图像的任意位置上,均能实现很高的攻击成功率。不过攻击只成功于生成攻击时对应的threat model,因此虽然文中没有明确体积,但本文应该是一篇在白盒场景下的工作。
  此外,作者通过对噪声图像的梯度进行监控,发现攻击成功不仅仅取决于patch区域,驳斥了“patch攻击成功的原因是patch区域对分类器而言更显著”的观点。

Method

  如图1所示,本文采用的攻击方法与常用的基于梯度优化的攻击方式原理一致,其主要区别在于两个点:
(1)由于patch攻击的特点,作者设置mask(用m∈{0,1}nm\in\{0,1\}^nm∈{0,1}n表示)来指示攻击区域,定义攻击后的图像为(1−m)⨀x+m⨀δ(1-m)\bigodot\,x+m\bigodot\,\delta(1−m)⨀x+m⨀δ,其中δ\deltaδ表示攻击噪声,同时,为了避免patch遮挡关键区域,作者将patch的位置设置在图像的四个角附近。
(2)如下式所示,作者设计了新的攻击目标,类似于margin loss,作者认为这可以拉开不同类别在特征空间的距离,并且加速收敛。其中,M(x)M(x)M(x)代表softmax层之前的logits向量。
argmaxδ[M(y=ytarget∣(1−m)⨀x+m⨀δ)−M(y=ysource∣(1−m)⨀x+m⨀δ)]\underset{\delta}{argmax}[M(y=y_{target}|(1-m)\bigodot\,x+m\bigodot\,\delta)-M(y=y_{source}|(1-m)\bigodot\,x+m\bigodot\,\delta)] δargmax​[M(y=ytarget​∣(1−m)⨀x+m⨀δ)−M(y=ysource​∣(1−m)⨀x+m⨀δ)]
  作者在网络域和图像域进行相关实验,其中,图像域要求归一化后的像素值在[0,1]范围内,而网络域则不加任何限制。类似于PGD攻击,在生成图像域攻击patch时,每个迭代步之后会进行像素值的裁剪工作(对应图1的标红区域)。
  以上均是针对单一图像固定位置生成的攻击,作者发现攻击patch在图像及位置之间均没有迁移性,即便将patch位移一两个像素,也会导致攻击不成功。因此,为了生成前文提到的universal的攻击,作者在每个迭代步中都使用不同的图像和位置,图像和位置的选取方法则是在uniform分布中随机获取。

图1 攻击算法整体流程

Experiments and Analysis

  在这里只讨论universal的攻击结果,关于单一图像固定位置的攻击,本质上与基于LpL_pLp​的全局攻击一样,攻击效果必然是可预见的非常好,对这部分感兴趣的朋友可以查阅原文。

攻击效果

  为了测试攻击对于patch位置的鲁棒性,作者按照每隔1个像素一次的密度,将生成的攻击patch添加到未参与攻击生成的图片的各个位置上,如图2所示,攻击几乎在任何位置都可以成功。作者在14个类别(各100张图片)的数据集上进行测试,在网络域场景下,发现83%的样本可以以超过0.9的置信度成功实现target攻击,超过97%的样本可以成功实现untarget攻击。
  为了测试攻击在图像间的鲁棒性,作者选择了100张未参与攻击生成的图片进行测试,在图像域场景下,虽然只有43%的图像实现了置信度0.9以上的target的攻击,但是有89%的图像实现了target攻击,并且100%的图像均可成功实现untarget攻击。
  此外,作者对于攻击效果与类别的关系进行了探讨,具体的实验结果可参考原文,作者发现图像特征复杂的类别(例如火山)更难被攻击成功,而图像特征较简单的类别(如排球)则更容易被攻击。

图2 patch攻击位置鲁棒性的测试结果

patch区域对分类器的影响

  此前的paper持有“patch攻击生效的原因是patch区域对分类器来说具有更高的显著性”的观点,为了验证这点的真伪,作者设计了相关的实验。作者将攻击图片导入分类器,并进行梯度的反传使得分类器逐渐偏向正确的分类结果,通过监控分类器结果对于原图的梯度,来分析图片中的各个区域对于攻击效果的影响。如图3可以发现,虽然patch区域占据一部分梯度,但是其他区域同样也分担了一部分梯度。而在部分样本中,patch区域的梯度只占一小部分。作者通过这个实验证明,分类器的错误输出不仅仅源于patch区域,也受到图像其他部分的影响,patch区域对于分类器来说更显著的理论是错误的。

图3 图像区域对于攻击效果的影响示意图

Paper笔记: 《LaVAN: Localized and Visible Adversarial Noise》相关推荐

  1. 论文笔记VITAL: VIsual Tracking via Adversarial Learning

    论文笔记VITAL: VIsual Tracking via Adversarial Learning 1. 论文标题及来源 2. 拟解决问题 3. 解决方法 3.1 算法流程 4. 实验结果 4.1 ...

  2. 【paper笔记】Personalized Top-N Sequential Recommendation via Convolutional Sequence Embedding

    科研生活开始了! 精读的第一篇paper 好久没有这么仔细地读一篇paper,以前读都只是知道大概意思就好了,很多细节选择忽略,因为很多时候论文只是需要知道这篇论文在干什么就好了(比如水报告的时候(ˉ ...

  3. [论文阅读笔记]Evading Defenses to Transferable Adversarial Examples by Translation-Invariant Attacks(CVPR)

    Evading Defenses to Transferable Adversarial Examples by Translation-Invariant Attacks(2019 CVPR Ora ...

  4. FCOS目标检测 paper笔记

    FCOS:Fully Convolutional One-Stage Object Detection是一个anchor free的detector, paper链接 github链接 anchor ...

  5. impala paper笔记

    不生产博客,只是汉化别人的成果 目录 摘要 介绍 用户角度的impala 物理schema设计 sql 支持 架构 state distribution catalog service FRONTEN ...

  6. Paper Reading:Image-to-Image Translation with Conditional Adversarial Networks

    Introduction 找到一个统一的框架来处理从图片生成图片(image-to-image translation)的任务,其中包含由label map合成图片,由eage maps 重建目标,图 ...

  7. 【论文阅读笔记】Explaining And Harnessing Adversarial Examples

    0.论文摘要 本文提出了对于对抗样本存在原因的新解释--神经网络的线性特性,并提出了快速有效生成对抗样本的方法以及基于对抗的模型训练方式. 1.对抗样本的线性解释 考虑如上公式,其中  代表一个生成的 ...

  8. 【paper笔记】ESAM: Discriminative Domain Adaptation with Non-Displayed Items to Improve Long-Tail

    ESAM: Discriminative Domain Adaptation with Non-Displayed Items to Improve Long-Tail Performance 阿里解 ...

  9. paper笔记 | 城市计算概述(郑宇)

    1 城市计算的概念和框架 1.1 城市计算的定义 城市计算是一个通过不断获取.整合和分析城市中多种异构大数据来解决城市所面临的挑战(如环境恶化.交通拥堵.能耗增加.规划落后等)的过程. 1.2 城市计 ...

最新文章

  1. 优秀!一鼓作气学会“一致性哈希”,就靠这 18 张图了
  2. Hinton口中破解宇宙终极秘密的GPT-3厉害在哪?这有篇涂鸦详解
  3. [保护模式]非PAE模式
  4. 2017-03-16 Codeforces 453A 概率期望,思维 UOJ 228(待补)
  5. VMware Horizon View 7.5 如何部署虚拟桌面, 专业技术咨询和购买
  6. oracle11g 端口,navicate 连接 oracle11g精简版监听不到端口和用户密码错误问题
  7. Gradle_04_解决多项目同级依赖时找不到符号的异常
  8. 经纬度,墨卡托等坐标转换
  9. IDEA+SpringBoot+Dubbo在webapp下创建前端页面
  10. scheduling.quartz.CronTriggerBean has interface org.quartz.CronTrigger as super class
  11. [转]Authority-check
  12. wordpress建立二级导航菜单
  13. 好长的一篇Android与iPhone的对比
  14. 如何更改ElementUI组件的图标大小以及标签属性
  15. JavaWeb重点笔记
  16. matlab-微分方程求解方法汇总
  17. 其实你孤独的像一只流浪狗
  18. 学习编程:能边玩边学的10个游戏编程网站,这样学编程可好玩了
  19. 计算机输入法如何显示在桌面快捷方式,电脑桌面输入法图标不见了怎么办
  20. 虚拟机M0n0wall软件防火墙配置

热门文章

  1. excel计算二元线性回归_用人话讲明白梯度下降Gradient Descent(以求解多元线性回归参数为例)...
  2. cadence 通孔焊盘_Cadence学习3(通孔类焊盘的建立)(转)
  3. 利用python爬取豆瓣电影top250
  4. 内含扩容源码的面试题,目标是手写HashMap!
  5. random.seed()的作用(python)
  6. Layer Tree 绘制
  7. [从头读历史] 第289节 神之物语 忒修斯的故事
  8. echarts+vue中国地图,点击进入省级地图
  9. 驱动器中的软盘不对_在“提示”框中:基于位置的待办事项提醒,DIY软盘驱动器音乐以及易于访问的产品手册...
  10. 怎样制作BT种子文件,即torrent后缀的文件?