#论文笔记#

1. 论文信息

论文名称 Clean-Label Backdoor Attacks
作者 Alexander Turner(MIT)
会议/出版社 ICLR 2019
pdf 本地pdf 在线pdf
代码 trojanzoo-clean-label**** Label-Consistent
其他 这篇文章和 Label-Consistent Backdoor Attacks 基本相同

简介:这篇文章是最早做干净标签下的后门攻击的文章。作者在 BadNets 上进行了一系列的实验证明在以往的方法中直接使用 clean-label 会导致攻击的失败。为了实现在 clean-label 下的攻击,作者使用了 GAN-based interpolation 和 adversarial p-bounded perturbations 来增加分类器的训练难度,让分类器学习到更多 backdoor 的信息。

2. introduction

以往的后门攻击方法是在数据上加入 backdoor trigger,并且更改该数据的标签。这种做法存在的问题是,通过人工检查可以轻易识别出异常的标签。所以本文提出了一种无需改变加毒数据集即可实现后门攻击的方法,称之为 clean-label attack。

因为是进行 target attack,最简单的想法就是在 target 类中加入 backdoor trigger。但是作者目标类中加入 badnet 的 backdoor trigger 进行实验。发现这种进攻是无效的。

  • 由上图可以看出,当 Posion rate 达到 25% 时也只有 50% 的攻击成功率
  • 本文选择的 trigger 是来源于 badnet 的攻击方法

这是因为模型在学习时,只有一小部分图像存在 trigger ,并且模型更倾向于学习图片中的自然特征,所以 trigger 很容易被忽略。无法与 target label 建立起强的关联。

这篇文章为了解决这个问题,提了要让模型学习目标类的特征更加困难,使得模型学习目标类时更加依赖于 trigger,使得 trigger 更容易与 target label 关联。

文章提出了两种方法,第一种是基于 GAN 的方法,一种是基于 Adversarial examples 的方法

3. method

方法一:Latent space interpolation using GANs

通过生成模型去生成一些带有噪声目标类的样本,增大目标类的学习难度。

首先在训练集上训练一个生成器,生成模型可以学习到样本分布的 latent space

选取目标类 x1x_1x1​ , 非目标类 x2x_2x2​,通过插值的方法生成带有噪声的目标类图片

IG(x1,x2,τ)=G(τz1+(1−τ)z2),I_{G}\left(x_{1}, x_{2}, \tau\right)=G\left(\tau z_{1}+(1-\tau) z_{2}\right), \quadIG​(x1​,x2​,τ)=G(τz1​+(1−τ)z2​), where z1=EG(x1),z2=EG(x2)z_{1}=E_{G}\left(x_{1}\right), z_{2}=E_{G}\left(x_{2}\right)z1​=EG​(x1​),z2​=EG​(x2​).

通过实验得出 τ\tauτ 的最佳值,既能让目标类难以学习,又能让人眼难以察觉

方法二:Adversarial examples bounded in lp-norm

最大化目标类样本和目标类标签,优化对抗扰动。使得目标类更难学习

xadv=argmax⁡∥x′−x∥p≤ϵ(x′,y,θ)x_{a d v}=\underset{\left\|x^{\prime}-x\right\|_{p} \leq \epsilon}{\operatorname{argmax}}\left(x^{\prime}, y, \theta\right)xadv​=∥x′−x∥p​≤ϵargmax​(x′,y,θ)

不同情况下的 backdoor image 的视觉效果对比

4. experiments

  • 数据集:cifar-10
  • 实验结果:

clean-label backdoor attacks 论文笔记相关推荐

  1. LIRA: Learnable, Imperceptible and Robust Backdoor Attacks 论文笔记

    论文信息 论文名称 LIRA: Learnable, Imperceptible and Robust Backdoor Attacks 作者 Khoa Doan(Baidu Research) 会议 ...

  2. When Does Machine Learning FAIL? Generalized Transferability for Evasion and Poisoning Attacks论文笔记

    When Does Machine Learning FAIL? Generalized Transferability for Evasion and Poisoning Attacks论文笔记 该 ...

  3. Poison Ink: Robust and Invisible Backdoor Attack 论文笔记

    1. 论文信息 论文名称 Poison Ink: Robust and Invisible Backdoor Attack 作者 Jie Zhang(中国科学技术大学) 会议/出版社 IEEE Tra ...

  4. DBA: Distributed Backdoor Attacks against Federated Learning论文笔记

      作者:Chulin Xie  Keli Huang  Pin-Yu Chen  Bo Li 来源:ICLR 2020 发表时间:May 26,2020   背景: 联邦学习能够聚合各方提供的信息, ...

  5. 《DBA: DISTRIBUTED BACKDOOR ATTACKS AGAINST FEDERATED LEARNING》阅读笔记

    DBA: DISTRIBUTED BACKDOOR ATTACKS AGAINST FEDERATED LEARNING ** 本文发在ICLR 2020,针对联邦学习进行的后门攻击.其提出的方案针对 ...

  6. Procedural Noise Adversarial Examples for Black-Box Attacks on Deep Neural Networks论文笔记

    Procedural Noise Adversarial Examples for Black-Box Attacks on Deep Neural Networks论文笔记 0. 概述 如今一些深度 ...

  7. Data-Efficient Backdoor 论文笔记

    #论文笔记# 1. 论文信息 论文名称 Data-Efficient Backdoor 作者 Pengfei Xia 中国科学技术大学 会议/出版社 IJCAI 2022 pdf

  8. [论文阅读] (02) SP2019-Neural Cleanse: Identifying and Mitigating Backdoor Attacks in Neural Networks

    神经清洁:神经网络中的后门攻击识别与缓解 Neural Cleanse: Identifying and Mitigating Backdoor Attacks in Neural Networks ...

  9. 论文笔记:Non-Profiled Deep Learning-based Side-Channel attacks with Sensitivity Analysis(DDLA)

    论文笔记:Non-Profiled Deep Learning-based Side-Channel attacks with Sensitivity Analysis(DDLA) Benjamin ...

  10. 标签平滑论文笔记:2020《When Does Label Smoothing Help?》

    标签平滑 介绍 实验1:标签平滑作用 实验2:针对ECE与温度缩放进行对比(作用相近) 实验3:标签平滑对知识蒸馏影响(变差) 实验3知识蒸馏:互信息I(X;Y) 链接 介绍   看成距离:   这里 ...

最新文章

  1. 【组队学习】【32期】scikit-learn教程
  2. java奇怪的问题_一个奇怪的Java集合问题
  3. msbuild 语法_用于删除文件的MSBuild Task语法
  4. c语言倒计时不影响进程_2017级C语言大作业 - 见缝插针
  5. SQL Server Window Function 窗体函数读书笔记二 - A Detailed Look at Window Functions
  6. MySQL创建索引跳过redo_明明我建了索引,为什么sql执行的还是这么慢?
  7. boost::contract模块实现lambda表达式的测试程序
  8. vb for循环 combobox的使用 Print的使用
  9. 物联网技术概论的课程编号_选课推荐 | 第5期:物联网技术概论
  10. 【ZOJ - 3703】Happy Programming Contest(带优先级的01背包,贪心背包)
  11. oracle实验四运动会,实验四oracle的安全性和完整性控制
  12. 【书摘001】android 底层开发技术实战详解 - 基础 - 进程管理的一些常用命令
  13. [搬运]MATLAB newff函数训练模式
  14. WannaCry 勒索软件
  15. 下载PDF文件及打印PDF文件
  16. Android跳转-ARouter详细使用教程
  17. mint-ui —— navbar的使用
  18. 网站制作教程:新手如何用PageAdmin建站系统做网站
  19. java运算符与数字分解,看完对java更加有信心了(主除以和取余的理解)
  20. git 重新追踪索引_索引追踪差距

热门文章

  1. 计算机工程学院运动会加油稿50字,校园运动会加油稿50字
  2. 淘宝搜索商品出现乱码是怎么回事?
  3. 由可乐加比萨化学反应引发的联想
  4. cls love even fib!(打表,找规律)
  5. 【防火墙_静态路由】
  6. 鸿蒙818与A73,荣耀智慧屏正式发布:鸿鹄818智慧芯片+鸿蒙OS,开启未来新视觉
  7. 安卓Tasker自动转发短信到邮箱
  8. APP支付(微信、支付宝)
  9. 支付宝支付-APP支付服务端详解
  10. ios无痕埋点_无痕埋点方案探究