关注:决策智能与机器学习,深耕AI脱水干货

作者 | 许凯第

源 |  ECCV 2020 

报道 | 机器之心

基于 AI 目标检测系统生成的对抗样本可以使穿戴者面对摄像头「隐身」。

由美国东北大学林雪研究组,MIT-IBM Watson AI Lab 和 MIT 联合研发的这款基于对抗样本设计的 T-shirt (adversarial T-shirt),让大家对当下深度神经网络的现实安全意义引发更深入的探讨。目前该文章已经被 ECCV 2020 会议收录为 spotlight paper(焦点文章)。

论文链接:https://arxiv.org/pdf/1910.11099.pdf

在人脸识别和目标检测越来越普及的今天,如果说有一件衣服能让你在 AI 检测系统中「消失无形」,请不要感到惊讶。

熟悉 Adversarial Machine Learning(对抗性机器学习)的朋友可能不会觉得陌生,早在 2013 年由 Christian Szegedy 等人就在论文 Intriguing properties of neural networks 中首次提出了 Adversarial Examples(对抗样本)的概念。而下面这张将大熊猫变成长臂猿的示例图也多次出现在多种深度学习课程中。

很显然,人眼一般无法感知到对抗样本的存在,但是对于基于深度学习的 AI 系统而言,这些微小的扰动却是致命的。

随着科研人员对神经网络的研究,针对神经网络的 Adversarial Attack(对抗攻击)也越来越强大,然而大多数的研究还停留在数字领域层面。Jiajun Lu 等人也在 2017 年认为:现实世界中不需要担心对抗样本(NO Need to Worry about Adversarial Examples in Object Detection in Autonomous Vehicles)。

他们通过大量实验证明,单纯地将在数字世界里生成的对抗样本通过打印再通过相机的捕捉,是无法对 AI 检测系统造成影响的。这也证明了现实世界中的对抗样本生成是较为困难的,主要原因归于以下几点:

像素变化过于细微,无法通过打印机表现出来:我们熟知的对抗样本,通常对图像修改的规模有一定的限制,例如限制修改像素的个数,或总体像素修改大小。而打印的过程往往无法对极小的像素值的改变做出响应,这使得很多对于对抗样本非常有用的信息通过打印机的打印损失掉了。

通过相机的捕捉会再次改变对抗样本:这也很好理解,因为相机自身成像的原理,以及对目标捕捉能力的限制,相机无法将数字领域通过打印得到的结果再次完美地还原回数字领域。

环境和目标本身发生变化:这一点是至关重要的。对抗样本在生成阶段可能只考虑了十分有限的环境及目标的多样性,从而该样本在现实中效果会大大降低。

近年来,Mahmood Sharif 等人(Accessorize to a crime: Real and stealthy attacks on state-of-the-art face recognition.)首次在现实世界中,通过一个精心设计的眼镜框,可以人脸检测系统对佩戴者做出错误的判断。但这项研究对佩戴者的角度和离摄像头的距离都有严格的要求。之后 Kevin Eykholt 等人(Robust Physical-World Attacks on Deep Learning Visual Classification)对 stop sign(交通停止符号)进行了攻击。通过给 stop sign 上面贴上生成的对抗样本,可以使得 stop sign 被目标检测或分类系统识别成限速 80 的标志!这也使得社会和媒体对神经网络的安全性引发了很大的探讨。

然而,这些研究都还没有触及到柔性物体的对抗样本生成。可以很容易地想象到,镜框或者 stop sign 都是典型的刚性物体,不易发生形变且这个类别本身没有很大的变化性,但是 T 恤不同,人类自身的姿态,动作都会影响它的形态,这对攻击目标检测系统的人类类别产生了很大的困扰。

最近的一些工作例如 Simen Thys 等人(Fooling automated surveillance cameras: adversarial patches to attack person detection)通过将对抗样本打印到一个纸板上挂在人身前也可以成功在特定环境下攻击目标检测器,但是却没有 T 恤上的图案显得自然且对对抗样本的形变和运动中的目标没有进行研究。

来自美国东北大学,MIT-IBM Watson AI Lab 和 MIT 联合研发的这款 Adversarial T-shirt 试图解决上述问题,并在对抗 YOLOV2 和 Faster R-CNN(两种非常普及的目标检测系统)中取得了较好的效果。通过采集实验者穿上这件 Adversarial T-shirt 进行多个场景和姿态的视频采集,在 YOLOV2 中,可以达到 57% 的攻击成功率,相较而言,YOLOV2 对没有穿 Adversarial T-shirt 的人类目标的检测成功率为 97%。

设计原理

从多个已有的成功的攻击算法中得到启发,研究者们通过一种叫 EOT (Expectation over Transformation) 的算法,将可能发生在现实世界中的多种 Transformation(转换)通过模拟和求期望来拟合现实。这些转换一般包括:缩放、旋转、模糊、光线变化和随机噪声等。利用 EOT,我们可以对刚性物体进行对抗样本的生成。

但是当研究者们仅仅使用 EOT,将得到的对抗样本打印到一件 T 恤上时,仅仅只能达到 19% 的攻击成功率。这其中的主要原因就是文章上述提到的,人类的姿态会使对抗样本产生褶皱,而这种褶皱是无法通过已有的 EOT 进行模拟的。而对抗样本自身也是非常脆弱的,一旦部分信息丢失往往会导致整个样本失去效力。

基于以上观察,研究者们利用一种叫做 thin plate spline (TPS) 的变化来模拟衣服的褶皱规律。这种变化需要记录一些 anchor points(锚点)数据来拟合变化。于是研究者将一个棋盘格样式的图案打印到 T 恤上来记录棋盘格中的每个方块角的坐标信息,如下图所示:

这些锚点的坐标可以通过特定的算法自动得到无需手动标记。这样一个人工构建的 TPS 变化被加入了传统的 EOT 算法。这使得生成的对抗样本具备抗褶皱扰动的能力。

除此之外,研究者们还针对光线和摄像头可能引起的潜在变化利用一种色谱图进行的模拟,如下图所示:(a)数字领域中的色谱图;(b)该图通过打印机打印到 T 恤只会在通过相机捕捉到的结果;(c)通过映射 a-b 学到的一种色彩变换。

基于学习出的色彩变化系统,使得生成的对抗样本能最大限度的接近现实。最终该方法的整体框架如下:

通过增强的 EOT 和颜色转换系统,最小化 YOLOV2 的检测置信度,最终得到一个对抗样本。

除此之外,研究者们也第一次尝试了 ensemble attack (多模型攻击)。利用一张对抗样本同时攻击两个目标检测系统 YOLOV2 和 Faster R-CNN。结果显示不同于传统的加权平均的攻击方,利用鲁棒优化技术可以提高对两个目标检测系统的平均攻击成功率。

实验结果

首先,研究者们在数字领域做了基础的比较试验,结果发现相较于非刚性变化—仿射变换,TPS 变化可以将攻击成功率在 YOLOV2 上从 48% 提升到 74%,在 Faster R-CNN 上由 34% 提升到 61%!这证明了对于柔性物体,加入 TPS 变化的必要性。

之后研究人员将这些对抗样本打印到白色 T 恤上,让穿戴者在不同场合以各种姿态移动并对其录制视频。最后将采集到的所有视频送入目标检测系统进行检测,统计攻击成功率。

如下面的动图所示:

最终,在现实世界中,该方法利用 TPS 生成的样本对抗 YOLOV2 可以达到 57% 的攻击成功率,相较而言,仅使用仿射变换只能达到 37% 攻击成功率。

除此之外,研究者们还做了非常详尽的 ablation study:针对不同场景,距离,角度,穿戴者姿势进行研究。

结果显示,提出的方法对距离的远近和角度变化较为敏感,对不同的穿戴者和背景环境变化表现出的差异不大。

关于 AI 安全的更多讨论

生成对抗样本其实和深度神经网络的训练是同根同源的。通过大量样本学习得到的深度神经网络几乎是必然的存在大量的对抗样本。就像无数从事 Adversarial Machine Learning(对抗性机器学习)的研究者一样,大家充分意识到了神经网络的脆弱性和易攻击性。但是这并没有阻碍我们对深度学习的进一步研究和思考,因为这种特殊且奇妙的现象来源于神经网络本身,且形成原因至今没有明确的定论。而如何构建更加鲁棒的神经网络也是目前该领域的 open issue。

该研究旨在通过指出这种特性,以及它有可能造成的社会潜在危害从而让更多的人意识到神经网络的安全问题,最终目的是帮助 AI 领域构建更加鲁棒的神经网络从而可以对这些对抗样本不再如此敏感。

第一作者介绍

许凯第:美国东北大学 ECE 系 PhD 三年级学生,主要研究领域为 Adversarial Machine Learning,研究内容已经在发表在 NeurIPS、ICML、ICCV、ECCV、CVPR、ICLR 等众多机器学习和计算机视觉会议。

交流合作

请加微信号:yan_kylin_phenix注明姓名+单位+从业方向+地点,非诚勿扰。

AI视觉对抗之隐身T恤「AI前沿」相关推荐

  1. 将AI落地到福州、贵阳的「幕后推手」,到底在想些什么?

    2020-07-10 15:48:51 乾明 金磊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 从抗击新冠肺炎的冲锋陷阵,到日常生活中的效率提升- 依图科技,正在用一次次行动,一座座城市,展 ...

  2. 马斯克刚骂了激光雷达,这篇用纯视觉代替激光雷达的名校论文「力挺」了他...

    昨天,第 N 次在公开场合 diss 激光雷达的马斯克,再一次让自动驾驶圈对无人车不同的传感器应用方案展开了热议. 实际上,如果站在马斯克的角度,我们其实不难理解他对激光雷达的「痛恨心理」. 毕竟特斯 ...

  3. 不要妄图一夜实现「智能」,这里有AI工业落地几乎必遇的「深坑」

    2020-03-30 17:08:50 作者:寓扬 疫情前,丰融出差去了趟重庆,跟一个客户谈工业大脑的方案.但项目还没来得及落地,疫情已经到来. 丰融是阿里云工业大脑首席解决方案架构师.春节期间,客户 ...

  4. AI视觉大牛朱松纯担任北大AI研究院院长,提出通过构建大任务平台走向通用AI...

    整理 | AI科技大本营编辑部 据北京大学新闻网9月24日报道,AI视觉顶级学者朱松纯正式任职北京大学讲席教授.人工智能研究院院长. 朱松纯表示,他与北大.清华的相关学者一直保持着密切的学术交流与合作 ...

  5. vue office在线编辑_多人协同、AI 协作……未来的 Office 有这些「黑科技」

    最近几个月里,「远程办公」成为了很多人的新选择.远程办公中,在线文档对于大多数公司来说都是必需品.多人协作.自动保存.无需下载客户端-- 这些优势让在线文档逐渐受到人们的青睐. 面对这样一个潜力巨大的 ...

  6. 吴恩达:AI是时候从大数据转向「小数据」了

    丰色 编译整理 量子位 | 公众号 QbitAI AI大牛吴恩达不久前刚被检测出新冠阳性,许多网友都向他表达了早日康复的祝愿. 如今,他的工作重心放在了他的Landing AI公司上. 这是一家专门面 ...

  7. 对抗新冠也用「梯度下降」,进化生物学家靠这个预测病毒进化方向

    行早 发自 凹非寺 量子位 | 公众号 QbitAI 自从新冠大流行以来,病毒的变异和进化就没有停止过:德尔塔,拉姆达,奥密克戎--在和人类的斗争中也一直抢先一步. 在不断研究病毒进化过程时,有没有一 ...

  8. AI视频抠图换背景,无需「绿幕」,也可达到影视级效果

    相信很多小伙伴在平时拍摄剪辑视频的时候,都会遇到视频背景杂乱的情况吧,这个时候都会想到像抠图一样,将视频中的人像抠出来换一个背景!那么具体应该怎么操作呢? 其实这个问题很简单,利用AI智能视频抠图,无 ...

  9. 斯隆奖新晋得主宋舒然:从视觉出发,打造机器人之「眼」

    来源:AI科技评论 作者 :陈彩娴 编辑 :岑峰 「我一直希望家里有一个机器人,可以帮我洗衣服.做饭.」 宋舒然谈道.而要实现这一设想,机器人视觉研究是不可缺少的一环. 近年来,计算机视觉与机器人的「 ...

  10. AI寒冬论作者再发文:「深」度学习对数据的理解太「浅」了

    http://blog.itpub.net/29829936/viewspace-2641915/ 2019-04-18 14:29:14 AI 寒冬论作者 Filip Piekniewski 再次发 ...

最新文章

  1. 【云周刊】第146期:史上最大规模人机协同的双11,12位技术大V揭秘背后黑科技...
  2. 别怕,BCH无惧攻击
  3. [待总结]高频率vim命令
  4. 开发人员安全行为规则_为开发人员改善生活的7条简单规则
  5. WCF 之 数据契约
  6. 2021计算机一级模拟29套,“智慧家”2021年第二十九期每周家庭套餐
  7. 【01】blockqote美化
  8. Instruments工具的使用
  9. 嵌入式系统开发笔记100:使用FlyMcu下载程序到STM32单片机
  10. BackTrack 4 R2安装VMware tools
  11. python小波去噪实验
  12. SPSS——秩和检验
  13. 低延迟视频传输 UDP JPEG图像压缩 opencv
  14. Word页面中底端如何画一条横线,再下端写文字?
  15. numpy.take()用法
  16. 【“玩物立志”-scratch少儿编程】亲手实现小猫走迷宫小游戏:其实挺简单
  17. 基于51单片机的心率脉搏计检测系统
  18. 器械传递的方法_手术器械的传递方法
  19. 话费对接充值平台_手机话费误充给他人怎么办?小编带你找运营商要回来
  20. 服务器修改万兆网卡为千兆,从千兆到万兆 惠普服务器网卡横向导购 上

热门文章

  1. 零基础怎么学习平面设计,学习平面设计需要多久?
  2. 事务控制语言(DTL)
  3. java.sql.SQLException: Access denied for user '''localhost' (using password: NO) 的处理方法
  4. VK1628 LED数显芯片,LED驱动显示液晶驱动兼用TM1628
  5. AR小项目的制作过程(一)
  6. 网关地址和网关IP是什么
  7. html画圣诞树—动态效果展示【炫酷合集】
  8. 【MML】华为MML AAA接口联调,Java版本
  9. 解决:香橙派orangepi3lts网口用不了 网口灯不亮 没反应
  10. python中整数类型取值范围有没有限制_python 数据库取值范围内