Interpreting Attributions and Interactions of Adversarial Attacks论文解读
Abstract
这篇文章尝试从探索对抗扰动对攻击任务的贡献度的角度来解释对抗攻击。我们基于Shapley值来估计不同图片区域对攻击cost下降的贡献程度。我们定义并量化了对抗扰动像素之间的interaction,并且将整个扰动图分解为相对独立的扰动组成部分。对扰动图的分解展示了对抗训练后的DNNs相比普通训练的DNN在foreground有更多的扰动组成部分。此外,相比于正常训练的DNN,对抗训练后的DNN有着更多主要降低真实类别分数的组成部分。上述的分析为理解对抗攻击提供了新的insight。
1 Introduction
在这篇文章中,作者主要的目的是探索对抗攻击后的信号处理过程,即,pixel-wise的扰动怎样互相作用来实现攻击。我们发明了一种新的方法来解释对抗攻击,主要有以下几个角度:
- 给定一张输入图片,对抗攻击的区域贡献通过判断每个图片区域对攻击cost(例如对抗扰动的LpL_pLp范数)的重要性来进行计算。如图1 (a2)所示,鸟的头部以及颈部区域对对抗攻击有着高贡献度。如果不允许对这两个区域进行扰动,那么攻击时对其他区域扰动的数量级会显著提升(之前在Perceptual Ball这篇论文上做的实验也验证了这点)。通过这种方式,攻击cost可能会显著增加。
区域贡献度(重要性)为理解对抗攻击提供了一个新的角度。我们通过使用Shapley值来计算和攻击cost有关的贡献度。
- 对抗攻击中的Pixel-wise相互作用以及扰动组成部分:给定输入图片的一张扰动图,我们更进一步定义并量化了扰动图中pixel-wise扰动的相互作用,我们将其命名为扰动像素。即,我们尝试探索扰动像素怎么相互作用来形成最终的攻击。根据[45](?),单个像素的adversarial power主要取决于这个像素附近的context,而不是仅仅单独依赖于每个扰动像素。例如,在图1 (b2)中,扰动像素AAA和BBB并没有对攻击做出直接贡献。Instead,它们相互作用形成了一个曲线来欺骗DNN。
扰动像素的互相作用可以基于博弈论进行定义。给定一个训练用于判别的DNN ggg以及一张对抗图片x′=x+δ∈Rnx'=x+\delta\in\mathbb{R}^nx′=x+δ∈Rn,y=g(x′)∈Ry=g(x')\in\mathbb{R}y=g(x′)∈R表示DNN的输出(这个输出也可以是一个一维向量)。我们让ϕi\phi_iϕi表示第i个扰动像素对输出yyy的重要性(贡献度),这通过Shapley实现。全部的扰动像素的贡献值满足g(x′)−g(x)=∑i=1nϕ(i)g(x')-g(x)=\sum\limits_{i=1}^n\phi(i)g(x′)−g(x)=i=1∑nϕ(i)。ϕS\phi_SϕS表示SSS中全部像素的总体重要性,注意SSS中的扰动像素是相互作用的。那么SSS中的相互作用就可以通过SSS的重要性改变进行定义,即我们忽略扰动相互的相互作用而仅仅直接将单个扰动像素的重要性进行加和。此时ϕS−∑i∈Sϕi\phi_S-\sum\limits_{i\in S}\phi_iϕS−i∈S∑ϕi就量化了相互作用。如果ϕS−∑i∈Sϕ>0\phi_S-\sum\limits_{i\in S}\phi>0ϕS−i∈S∑ϕ>0,这就代表了SSS中的扰动像素互相合作,表现出了正向互相作用,如果ϕS−∑i∈Sϕ<0\phi_S-\sum\limits_{i\in S}\phi<0ϕS−i∈S∑ϕ<0,那么这证明了SSS中的扰动像素互相冲突,表现出了负向互相作用。
没源码,先不看了
Interpreting Attributions and Interactions of Adversarial Attacks论文解读相关推荐
- AttnGAN: Fine-Grained Text to Image Generation with Attentional Generative Adversarial Networks论文解读
题目:AttnGAN:具有注意的生成对抗网络的细粒度文本到图像生成 时间:2018 作者:Tao Xu, Pengchuan Zhang, Qiuyuan Huang, Han Zhang, Zhe ...
- RGCF:Learning to Denoise Unreliable Interactions forGraph Collaborative Filtering论文解读
这篇和之前的一篇工作简称是一样的,但是内容完全不同,本文是Robust Graph Collaborative Filtering (RGCF),注意甄别 一.前言 最近,图神经网络(GNN)作为一种 ...
- 【论文学习】《Who is Real Bob? Adversarial Attacks on Speaker Recognition Systems》
<Who is Real Bob? Adversarial Attacks on Speaker Recognition Systems>论文学习 文章目录 <Who is Real ...
- [论文阅读笔记]SEMANTIC ADVERSARIAL ATTACKS: PARAMETRIC TRANSFORMATIONS THAT FOOL DEEP CLASSIFIERS(ICCV)
SEMANTIC ADVERSARIAL ATTACKS: PARAMETRIC TRANSFORMATIONS THAT FOOL DEEP CLASSIFIERS(2019 ICCV) 文章简介: ...
- [论文解读] Adversarial Attacks on Deep Learning Models in Natural Language Processing: A Survey
Adversarial Attacks on Deep Learning Models in Natural Language Processing: A Survey 文章目录 Adversaria ...
- 论文阅读-Exploring Frequency Adversarial Attacks for Face Forgery Detection(探索用于人脸伪造检测的频率对抗性攻击)
一.论文信息 论文名称:Exploring Frequency Adversarial Attacks for Face Forgery Detection 会议:CVPR 2022 作者团队: 二. ...
- 论文代码复现Enhancing the Transferability of Adversarial Attacks through Variance Tuning
<Enhancing the Transferability of Adversarial Attacks through Variance Tuning>CVPR2021 论文下载地址 ...
- KDD2018《Adversarial Attacks on Neural Networks for Graph Data》 论文详解
Adversarial Attacks on Neural Networks for Graph Data 论文链接:https://arxiv.org/pdf/1805.07984.pdf evas ...
- 论文阅读-FDA Federated Defense Against Adversarial Attacks for Cloud-Based IIoT Applications
FDA: Federated Defense Against Adversarial Attacks for Cloud-Based IIoT Applications (这里的对抗攻击都有哪儿些 - ...
- 论文学习:Practical Adversarial Attacks Against Speaker Recognition Systems
文章题目:Practical Adversarial Attacks Against Speaker Recognition Systems 来源:ACM HotMobile 2020 链接:http ...
最新文章
- fetch使用的常见问题及解决办法
- ida提取hashab算法记录
- UVa 242 邮票和信封(完全背包)
- 调整表格的行高_Word表格无法调整行高?尽然是这个原因,90%的人都可能遇到...
- Java-String类型的参数传递问题
- java char指针数组_sizeof与strlen使用,字符串指针数组
- 使用Jersey跨服务器上传图片 报405 Method Not Allowed错误
- java.lang.stackoverflowerror_java.lang.StackOverflowError——如何解决StackOverflowError错误
- 《团队-爬取豆瓣电影TOP250-设计文档》
- scatterpie | ggplot2的几何图形拓展包(1):如何在地图中添加饼图
- 【C#版本详情回顾】C#2.0主要功能列表
- LeetCode—1.快速排序算法
- 排序算法专题-选择排序
- 把手机上B站App缓存的视频转换为正常的mp4格式视频
- 淘宝618超级红包可以叠加使用吗?
- 网络、如何通信、TCP/IP协议
- nvm: node版本管理器[使用教程]
- 原生js实现上拉加载
- ENVI中出现tif文件无法直接打开
- 直流无刷电机(BLDC)转速闭环调速系统及Matlab/Simulink仿真分析(二)
热门文章
- linx文件服务器命令,linux服务器文件命令
- php万年历月份处理_PHP 万年历实现代码
- java 悬浮提示框_弹出提示框的方式——java
- Flink Remote Shuffle 开源:面向流批一体与云原生的 Shuffle 服务
- Flink on Zeppelin (3) - Streaming 篇
- Android Multimedia框架总结(十八)Camera2框架从Java层到C++层类关系
- 史上最全Android Studio快捷键 -2016-02-28
- php 修改文件的权限_php修改文件权限
- 安卓日记本设计内容介绍_天一 | 教你捷径,使用VB开发安卓程序!
- linux django 安装mysql_Linux下安装Python3和django并配置mysql作为django默认服务器