本文为52CV粉丝鬼道投稿,介绍了对抗学习领域最新的工作Adv-watermark。

论文标题:Adv-watermark: A Novel Watermark Perturbation for Adversarial Examples

论文链接:https://arxiv.org/pdf/2008.01919.pdf

引言

对抗样本生成的方法有很多,但它们都是在原图像上添加对抗扰动。本文提出的生成对抗样本的的方法很有趣,它是利用水印的不可察觉性,在水印上做文章从而生成对抗样本,即在干净图像中添加有意义的水印也可以攻击深度神经网络模型。如下图所示是分别是字母水印对抗样本和logo水印的对抗样本。

1.论文的贡献

本文的贡献可以归结如下三点:

  • 作者提出了一种新的对抗样本算法Adv-watermark。水印同时具有水印特性(版权保护)和对抗样本的功能(导致训练好的模型误分类),需要注意的一点在于除了水印区域并没有其它的对抗扰动。

  • 作者提出一种基于Adv-watermark的优化算法论文称为BHE。该优化方法采用基于种群的全局搜索策略方式生成对抗性样本。

  • 实验结果显示,当水印大小为宿主图像大小的4/9(个人感觉扰动的像素过多,有点违背对抗样本的定义)时,它可以获得97%以上的攻击成功率。水印大小是宿主图像大小的1/16,也可以达到65%左右的攻击成功率。

2.算法介绍

2.1对抗水印

论文中使用除了R,G,B以外还有alpha共四个混合通道来生成对抗水印,通道是指背景图像中前景区域的透明度。论文中用表示alpha通道的值,表示尺寸为的宿主图像(称为宿主图片很准确即为无对抗扰动的图片),表示尺寸为的水印图像,表示生成的图像,当,时,其生成对抗水印公式为:

当 , 时,计算公式为:

其中表示图像x,下标, 为表示像素位置,,表示水印图像嵌入的位置。作者不仅使用了图像水印,而且还使用了文本水印。

对于文本水印,首先将文本转换为图像,然后对其进行处理。

对于图像水印,使用了加州大学伯克利分校、芝加哥大学、麻省理工学院、剑桥大学和斯坦福大学这几所名校的标志水印。上面公式很好理解,如下图所示为上述原理和公式的图示。

2.2问题凝练

论文中将对抗扰动伪装成水印,以实现隐蔽性,并且对抗样本的生成只与水印的位置和透明度有关。对抗水印图像的生成可以形式化为一个有约束的优化问题。假设宿主图像为,分类模型为,的正确分类类别为,其中是属于类的概率,同时设为水印图像,为生成水印函数。它将水印图像嵌入到宿主图像的位置,,和依赖于,,。

在无目标攻击的情况下,可以将生成对抗样本的目标转化为寻找最优解,具体的优化公式如下所示:

该问题涉及两组参数,第一组参数是水印在宿主图像中的位置;第二组参数是水印的透明度。在宿主图像中嵌入可看作是一个实际扰动的对抗性水印,可以对局部进行修改主机映像的信息。对抗性水印扰动允许干净图像成为对抗样本。

对抗水印在不影响图像视觉效果的前提下,干扰决定图像分类的重要局部区域,攻击训练良好的分类模型。如下图所示为梯度加权类激活映射生成的热力图,可以清楚地看到Resnet101将输入图像预测为相应的正确类。

将对抗水印嵌入到图像中,可以改变生成的热图上概率分布。其中图中的第一行是原始图像(通过Resnet101正确分类)及其对应的热力图,下排是带有可见水印的对抗性图像及其对应的热图。

2.3优化算法BHE

论文中提出了一种新的优化算法为BHE。该方法是一种启发式随机搜索算法,可用于求解多元函数的全局最小值。如下图所示,BHE包括四部分,本文接下来会依次展开说明。

BHE是一种基于群体进化的优化算法,个人感觉BHE这就是一种普通的粒子群算法,适合求解非凸函数的最优解或者是局部最优解。每个解决方案都是一个群体的个体。其中、和元素被认为是其基因。

设表示第代人口中的第个个体,并且表示的第个基因。所以会有如下公式:

在该公式中,为初始群体中第个个体的第个基因,为第个基因的最小值,为第基因的最大值。

Basin Hopping是一种随机优化算法。在每次迭代过程中,BH生成一些随机扰动的新坐标,然后找到局部极小值,最后根据最小函数值接受或拒绝新坐标,具体的计算公式如下所示:

下图给出了BHE算法的具体流程:

3. 实验结果 

该论文的实验量很大,从各个角度对论文中所提出的算法进行评估。下表为图像水印和文本水印的平均攻击成功率。可以看出论文中所提出的BHE 可以获得较高的攻击成功率。对于大学标志水印,当水印大小设置为宿主图像大小的4/9时,攻击成功率可达97%左右。当水印大小设置为宿主图像大小的1/16 时,攻击率也可以达到69%。

下表为不同水印的攻击结果比较。可以看出在限制了攻击区域情况下,作者所提出的攻击方法也能获得比较不错的效果。

下表为黑盒攻击方法攻击成功率的,作者所提的攻击方法可以获得平均攻击成功率高达88%,是所有攻击方法里效果最好的。

下表为图像防御方法的比较,将生成的对抗样本、缩放比例为1/4的“ACMMM2020”图像水印和字体为“28”的红色文本水印注入到原始图像数据集中,并分别对它们重新训练了三个Resnet101,可以看出用该对抗样本进行对抗训练的模型具有更强的鲁棒性。

下图为各种电视台标识的对抗样本,其中原始的类标签是黑色的,而对抗样本的类标签是红色的。将logo的嵌入位置限制在主机图像的右上角,然后使用该论文提出的方法进行生成,可以看出对抗水印在物理世界中更为现实和常见。

下图为对抗水印和正常水印的比较图。红色曲线表示对抗水印,蓝色曲线表示正常水印。可以看出红色曲线是随机选取的30幅带有对抗性水印的图像的平均结果,蓝色曲线是30幅具有正常水印的相同图像的平均结果。很明显,水印扰动随着层次的增加而逐渐增大。

目前还未发现该文有开源代码。

备注:对抗学习

对抗学习交流群

交流对抗学习等最新资讯,若已为CV君其他账号好友请直接私信。

我爱计算机视觉

微信号:aicvml

QQ群:805388940

微博知乎:@我爱计算机视觉

投稿:amos@52cv.net

网站:www.52cv.net

在看,让更多人看到  

对抗攻击之利用水印生成对抗样本相关推荐

  1. 生成对抗网络gan原理_生成对抗网络(GAN)的半监督学习

    前言 如果您曾经听说过或研究过深度学习,那么您可能就知道MNIST, SVHN, ImageNet, PascalVoc或者其他数据集.这些数据集都有一个共同点: 它们由成千上万个有标签的数据组成. ...

  2. 要让GAN生成想要的样本,可控生成对抗网络可能会成为你的好帮手

    如何让GAN生成带有指定特征的图像?这是一个极有潜力.极有应用前景的问题,然而目前都没有理想的方法.韩国大学电子工程学院Minhyeok Lee和Junhee Seok近期发表论文,就生成对抗网络的控 ...

  3. 基于改进型生成对抗网络生成异构故障样本的方法

    文章地址:A Modified Generative Adversarial Network for Fault Diagnosis in High-Speed Train Components wi ...

  4. 利用生成对抗网络生成海洋塑料合成图像

    问题陈述 过去十年来,海洋塑料污染一直是气候问题的首要问题.海洋中的塑料不仅能够通过勒死或饥饿杀死海洋生物,而且也是通过捕获二氧化碳使海洋变暖的一个主要因素. 近年来,非营利组织海洋清洁组织(Ocea ...

  5. 一文尽览!文本对抗攻击基础、前沿及相关资源

    // 导读 深度学习的安全性问题已经逐渐被学术界.工业界所认识到并且重视,就文本领域而言,垃圾邮件检测.有害文本检测.恶意软件查杀等实用系统已经大规模部署了深度学习模型,安全性对于这些系统尤为重要. ...

  6. 任何网络都能山寨!新型黑盒对抗攻击可模拟未知网络进行攻击 | CVPR 2021

    来源:AI科技评论本文约3500字,建议阅读9分钟本文解读对抗攻击与元学习联姻的两篇典型的论文. 最近几年,元学习风生水起,这阵风也刮到了对抗攻击领域.本文解读对抗攻击与元学习联姻的两篇典型的论文(本 ...

  7. “忽悠”智能机器人,竟然改改物品纹理就成功了!北航新研究:时空融合对抗攻击算法...

    作者:刘艾杉 编辑:鱼羊 量子位 报道 | 公众号 QbitAI 简单修改环境物体的纹理颜色,就能让机器人执行攻击者设计的错误行为! 来自北航.悉尼大学.伯克利和伦敦大学的一项最新研究成果显示: 通过 ...

  8. 黑盒攻击很难?元学习提高黑盒对抗攻击成功率

    关注公众号,发现CV技术之美 本文分享论文『Boosting Black-Box Adversarial Attacks with Meta Learning』,元学习提高黑盒对抗攻击. 详细信息如下 ...

  9. 图像分类白盒对抗攻击技术总结

    目录 1.对抗攻击背景知识 2.白盒攻击技术 2.1 基于直接优化得攻击方法 2.1.1 基于 Box-constrained L-BFGS 的攻击 2.1.2 C&W 攻击 2.2 基于梯度 ...

最新文章

  1. KVM虚拟化笔记(十三)------kvm虚拟机静态迁移
  2. java创建医生的对象_基于安卓Android的作物医生App设计开发(MySQL)(含录像)
  3. 以SYSTEM用户运行CMD
  4. 1816. 截断句子
  5. python如何安装pdfminer_|请教在python3中安装pdfminer.six的方法
  6. PTA13、随机生成密码 (10 分)
  7. vue webpack压缩代码_webpack不混淆、不压缩指定js文件
  8. sql azure 语法_Azure Kubernetes服务(AKS)中SQL Server
  9. 通过实验来理解代理ARP(二)
  10. 3.5英寸万转硬盘的末路(万转“偏瘫”记连载二)
  11. Less/Sass 定制私人常用方法库
  12. 新浪财经三人行:专家谈萨班斯法案聊天实录
  13. python破解excel进入密码(密码字典)
  14. 清华大学模拟电子技术视频教程
  15. DNS无法解析IP_DNS大全(114DNS 、阿里DNS、百度DNS 、360 DNS、Google DNS)
  16. 三菱数据移位指令_三菱FX系列PLC循环与移位类指令的使用方法
  17. 利用gpu加速神经网络算法,为什么用gpu 模型训练
  18. Mysql主从复制和Redis主从复制
  19. SCI从入门到精通(第一版)
  20. SQl server 2008 r2 迅雷下载地址

热门文章

  1. 正则表达式必知必会学习笔记
  2. CSU 1112 机器人的指令
  3. crontab 周日_linux之crontab命令
  4. java script 月日年转年月日_javasrcipt日期一些方法和格式转化
  5. java 图片上传_java web图片上传和文件上传实例
  6. python表示数字6_Python3 数字Number(六)
  7. java反射源码_java反射技术详解附源码
  8. linux目录形式,linux 系统下 ngnix 显示目录形式
  9. matlab plot 多种颜色_Matlab画图,只需要这几步
  10. 计算器百分号如何用代码实现_如何用 100 行 Python 代码实现新闻爬虫?这样可算成功?...