鱼羊 发自 凹非寺
量子位 报道 | 公众号 QbitAI

自打有了deepfake,再也不敢相信「眼见为实」了。

要说把朱茵换脸成杨幂,把海王换脸成徐锦江,大家还可以一笑而过。

图源:微博用户@慢三与偏见

可若是公众人物被deepfake了什么不该说的话、不该做的事,就让人细思极恐了。

为了防止世界被破坏,为了维护世界的和平,(狗头)现在,阿里安全图灵实验室也加入了“围剿”deepfake的队列:

打造deepfake检测算法S-MIL,多人现场视频,只要其中1人被换脸,就能精准识别。

基于多实例学习的deepfake检测方法

魔高一尺,道高一丈。deepfake和deepfake检测技术的较量其实早已展开。

不过,此前存在的deepfake检测方法主要分为两类:帧级检测和视频级检测。

基于帧级的方法需要高成本的帧级别标注,在转化到视频级任务时,也需要设计巧妙的融合方法才能较好地将帧级预测转化为视频级预测。简单的平均值或者取最大值极易导致漏检或误检。

而基于视频级别的检测方法,比如LSTM等,在deepfake视频检测时,过多专注于时序建模,导致deepfake视频的检测效果受到了一定的限制。

部分deepfake攻击,四个人中只有一人被换脸

为了解决这些问题,阿里安全图灵实验室的研究人员们提出了基于多实例学习的Sharp-MIL(S-MIL)方法,只需视频级别的标注,就能对deepfake作品进行检测。

核心思想是,只要视频中有一张人脸被篡改,那么该视频就被定义为deepfake视频。这就和多实例学习的思想相吻合。

在多实例学习中,一个包由多个实例组成,只要其中有一个实例是正类,那么该包就是正类的,否则就是负类。

S-MIL就将人脸和输入视频分别当作多实例学习里的实例和包进行检测。

并且,通过将多个实例的聚合由输出层提前到特征层,一方面使得聚合更加灵活,另一方面也利用了伪造检测的目标函数直接指导实例级深度表征的学习,来缓解传统多实例学习面临的梯度消失难题。

具体而言,算法主要由三个关键部分组成。

首先,对输入视频中的采样帧进行人脸检测,并将提取的人脸喂给CNN,以获取特征作为实例。

在实例设计上,与传统多实例学习的设定一样,实例与实例间是相互独立的。

但由于deepfake是单帧篡改的,导致同一人脸在相邻帧上会有一些抖动,就像这样:

为此,研究人员设计了时空实例,用来刻画帧间一致性,用于辅助deepfake检测。

具体而言,使用文本分类里常用的1-d卷积,使用不同大小的核对输入的人脸序列从多视角上进行编码,以得到时空实例,用于最终检测。

也就是说,第二步,是将编码后的时空实例提取出来,形成时间核大小不同的时空包。这些包被一起用来表示一段视频。

最后,对这些包进行S-MIL,算出所有包的fake分数,这样,就能得到整个视频的最终fake分数,从而判断视频到底是不是deepfake。

S-MIL定义如下:

其中,pi和p(i)^(j)分别是第i个包及其包里的第j个实例的正类概率;M为包里的实例数;w是网络参数;h(i)^(j)是包i里的实例j对应的特征。

由于现有的带帧标签的数据集中,同一视频中真假人脸混杂的样本较少,研究人员还构建了一个部分攻击数据集FFPMS

FFPMS共包含14000帧,包括4种类型的造假视频(DF、F2F、FS、NT)和原始视频,既有帧级标签,也包含视频级标签。

检测效果达到SOTA

研究人员在DFDC、Celeb和FFPMS数据集上对S-MIL进行了评估。

实验结果表明,假脸的权重比较高,说明该方法在仅需视频级别标签的情况下,可以很好地定位到假脸,具有一定的可解释性:

并且,该方法在视频检测上能到达到state-of-the-art的效果。

团队介绍

据阿里安全图灵实验室资深算法专家华棠介绍,截止目前,阿里已经将该检测技术使用在内容安全场景中,后续也会在直播场景中进行布局。

阿里安全成立于2005年,目标是面向阿里巴巴经济体建立全面的网络安全、业务安全、数据安全与平台治理的管理机制,利用大数据构建强大的实时风险防御能力。

目前所涵盖的业务范畴既包括最底层的设备层、网关层以及流量层的网络威胁防御,也包括了业务层的安全治理,例如账号安全、假货与欺诈识别、内容合规、数据及信息保护、营商环境治理等等。同时,安全中台能力还全面输出给阿里巴巴经济体内的跨境公司以及生态伙伴。

阿里安全图灵实验室是阿里安全旗下的机器学习研发团队,从事安全与风险方面的AI系统研发,核心技术包括计算机视觉、自然语言处理、生物特征识别、AI安全、图计算以及异常检测和分析等。

传送门

论文地址:
https://arxiv.org/abs/2008.04585

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

每天5分钟,抓住行业发展机遇

如何关注、学习、用好人工智能?

每个工作日,量子位AI内参精选全球科技和研究最新动态,汇总新技术、新产品和新应用,梳理当日最热行业趋势和政策,搜索有价值的论文、教程、研究等。

同时,AI内参群为大家提供了交流和分享的平台,更好地满足大家获取AI资讯、学习AI技术的需求。扫码即可订阅:

加入AI社群,与优秀的人交流

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

AI在茫茫人海中,看到只有你被Deepfake了丨阿里安全出品相关推荐

  1. 在茫茫人海中发现相似的你——局部敏感哈希(LSH)

    一.引入 在做微博文本挖掘的时候,会发现很多微博是高度相似的,因为大量的微博都是转发其他人的微博,并且没有添加评论,导致很多数据是重复或者高度相似的.这给我们进行数据处理带来很大的困扰,我们得想办法把 ...

  2. 【C语言】如何茫茫人海中找出总分最高的学生

    给定N个学生的基本信息,包括学号(由5个数字组成的字符串).姓名(长度小于10的不包含空白字符的非空字符串)和3门课程的成绩([0,100]区间内的整数),要求输出总分最高学生的姓名.学号和总分. / ...

  3. TensorFlow安装配置,茫茫人海中一瞥

    深度学习的框架,我们熟知的有caffe,torch和convnet.最近,Google又搞了一个TensorFlow,已经开源:http://www.tensorflow.org/.据说,谷歌的深度学 ...

  4. 茫茫人海中,一眼选中你!

    一.jQuery基础选择器和层级选择器 1. jQuery 基础选择器 原生JS获取元素方式很多,很杂,而且兼容性情况不一致,因此jQuery给我们做了封装,使获取元素统一标准. $("选择 ...

  5. 元宇宙系列之AI虚拟人:“人”潮汹涌 探路未来

    尽管元宇宙尚处不断扩充定义的进程中,但市场对于虚拟人在其中扮演关键要素已达成一定共识.我们认为,从中短期视角看,虚拟人相关技术逐步落地,应用场景持续拓宽,或为元宇宙概念下技术.内容及产业融合升级的初步 ...

  6. AI虚拟数字人直播带货软件 AI数字人直播间怎么搭建 搭建教程分享

    随着近年来移动互联网和直播行业的迅猛发展,越来越多的企业开始将直播带货作为新的营销渠道.AI虚拟数字人直播带货软件则是在这样的背景下应运而生的一种全新的直播带货形式. 一.AI虚拟数字人直播带货软件的 ...

  7. 基于AI+RT-THREAD的人检测入侵检测摄像头(一 AI模型的导入及处理)

    RT-AK+RT-THREAD+ART-PI的人检测入侵检测摄像头 简介:该项目基于ART-PI+RT-THREAD平台开发了一套基于人检测AI的网络摄像头,当遥控开启时将自动检测人的特征并判断,若有 ...

  8. 【讲座回顾】不会被AI取代的人

    ​科技发展,时代进步,我们的生活越来越便利,AI更是渗透到我们生活的方方面面,如超市自付款扫码.手机上的语音助手.智能门锁.机器人等一系列超乎想象的产品,这些产品无一例外给我们带来了惊喜与享受,但与此 ...

  9. 因为AI不是人,美国专利局拒绝认定TA的所有发明权

    贾浩楠 发自 凹非寺 量子位 报道 | 公众号 QbitAI 「你不是人!」--美国专利局(USPTO). 这句话是美国专利局,对所有人工智能说的. 4月27日,美国专利局出台一项规定:对于任何由人工 ...

最新文章

  1. 用Python偷偷告诉你十一假期8亿人都去哪儿浪?
  2. 如何写一个脚本语言_如何写一个Nx schematic plugin?
  3. geojson地图_ThingJS的三维城市地图搭建逻辑解析
  4. html5元素拖动 (转载黑桐)
  5. word存为html图片有两个,如何批量保存Word图片?另存为Word多个图片的方法
  6. iphone UILabel 顶部对齐(top align)
  7. [Ajax] 超于json2.js的版本json3.js
  8. 公司周刊-非常6+1—营销平台小组
  9. 需求分析模板_可以从哪些方面进行财务分析?财务分析模板实例拿去套用吧
  10. 典型相关分析CCA计算过程
  11. linux设置自动获取ip命令,详解如何设置CentOS 7开机自动获取IP地址
  12. 如何创建GOOGLE ADS的MCC经理账户,有什么好处?
  13. 高精度ua级恒流源_一种高精度可调恒流源电路的制作方法
  14. 【系统分析师之路】系统分析师知识地图
  15. 秋风荷桂香 晚风拂夕阳
  16. 创建系统映像时包含了 D、E 盘
  17. 2019年最值得学习的编程语言TOP5
  18. 设计模式学习--观察者模式(Observer Pattern)
  19. 微信小程序本地服务器搭建
  20. VBA基础语法:循环语句

热门文章

  1. 如何正确强制执行Git推送?
  2. 从JavaScript数组获取随机值
  3. Oracle分析函数巧妙使用
  4. linux shell里面nohup的用法
  5. Java 多线程(三)线程间的通信jdk1.5中Lock,Condition---生产者消费者为例
  6. ASP.Net中MD5和SHA1加密的几种方法
  7. java list接口为何要重新声明collection接口的方法_JAVA Collection接口中List Map 和Set的区别(转)...
  8. shell mysql e_xshell怎么搭建mysql
  9. 如何查看抓包文件所使用的捕获过滤器
  10. 磁盘修复工具TestDisk