Deepfake是一款非常火的AI换脸工具,可以将专业复杂的AI换脸过程简单化,实现快速换脸,制作的内容甚至可以以假乱真。

但是,现在的技术不仅可以判断照片是否假冒伪劣,还可以跟踪所有背后的信息,你信吗?

这不,最近Facebook密歇根州立大学的研究团队合作,提出了一种可对Deepfake 伪造的图片采取逆向工程的研究方法:

通过对模型生成的图片进行逆向工程,分析出模型的超参数,估计出网络架构训练损失函数

这些参数和模型是一一对应的,可以直接反映出用什么模型方法生成的图片。

对于这项“逆向工程”的研究,Facebook的研究负责人Tal Hassner说:

识别未知模型的特征非常重要,因为Deepfake软件加入未知的图片非常容易。当调查人员试图追踪时,坏人可能会想办法掩盖他们的踪迹。

而如果我们发现不同地方上传的图片,都来自同一个模型,我们就可以找到生成这些内容的电脑,并判断其就是罪魁祸首。

因此,Facebook 的这项新技术简直是社交打假的福音啊!

让我们来看看它的原理是什么?

Deepfake的逆向工程

现在已经能够分辨一张图片是Deepfake合成的脸,还是真实的脸。

但这远远不够,社交网络中肯定还需要判断图片的归属,以及生成图片背后的信息。

Facebook提出用逆向工程处理Deepfake问题,但它并不是机器学习中的一个新概念。

之前的逆向工程机器学习模型类似黑盒测试,就是通过检查其输入和输出来得到模型。

这种方法往往依赖于模型本身已有的知识,但现实世界中往往缺乏已有的知识,所以实用性不高。

研究团队采用的逆向工程方法,主要依赖的是:

用于生成Deepfake图片的模型背后的架构特征。

这些特征被称为超参数,密歇根州立大学 Vishal Asnani 的团队确定了这些超参数,并设计了一种“指纹估计网络”和“模型解析”的流程化方法对其进行深入分析。

“指纹估计网络”和“模型解析”

对生成模型的图片进行逆向工程,应该从哪里入手呢?

答案是可以从“指纹”入手,它是图片在处理过程中留下的信息。

正是因为Deepfake处理过的内容,会在图片上留下一个独特的“指纹”,所以可以凭借这些“指纹”信息进行逆向工程,分析出其独特的网络架构和损失函数,追踪其来源。

具体来说,研究团队首先通过一个指纹估计网络(FEN)来检测Deepfake的图片。

为了缩小工作范围,研究团队将“指纹”的特性(包括大小、重复性、频率范围和频率响应)作为开发约束条件的基础,进行无监督训练。

一旦“指纹”生成,就可以作为模型解析的输入。

然后,研究人员设计了一种模型解析网络的方法,既分析了用于创建Deepfake的模型的网络架构,也估计了训练的损失函数。

研究团队对网络架构中的一些连续参数进行了归一化处理,以方便训练,还对损失函数类型进行了分类,进行了分层学习。

由于生成模型在网络架构和训练的损失函数方面各不相同,因此从Deepfake得到超参数的过程,可以让它对应的模型的各类特征“无处遁形”,这也是逆向工程在这类应用中的神奇之处。

下面来看看它的网络架构和损失函数是怎么预测出来的。

网络架构预测

这项研究的主要难点在于预测网架构,因为深度网络一般有几百万个网络参数,所以很难预测。

但是网络架构的超参数比网络参数要少得多,估计起来相对容易。

在实际操作过程中,将超参数分为连续和离散两种:

对连续参数采用回归参数估计,由于参数有不同的范围,需要最小最大实现归一化。

由于离散参数是不平衡的,因此对每个参数会采用加权交叉熵处理。

损失函数预测

除了网络架构以外,生成模型的学习网络参数也可以影响图片上的“指纹”,这些网络参数由训练数据和模型的损失函数决定。

所以,研究人员分析了从“指纹”预测损失函数的可能性。

为了避免复杂,研究人员将损失函数分为像素损失,鉴别损失和分类损失。

如图所示,在这种分类基础上,可以进一步用分层学习预测损失函数,每个损失可以通过相应因子的乘积求得。

最终,整体的损失函数可以用各类损失函数的总和计算求得。

其他应用

除了模型解析,“指纹”估计网络还可用于Deepfake检测和图片归因:

研究团队设置了一个浅层网络,针对输入估计的“指纹”进行二进制简化,来实现Deepfake检测,并通过类别划分来实现图片归属的分析。

虽然“指纹估计方法”的初衷并不是主要针对这两项任务,但研究团队在这两项任务上也取得了相当好的结果。

效果怎么样?

让我们来看看逆向工程的实际效果。

估计网络架构和损失函数的标准交叉熵和加权交叉熵如下图,其中每种情况的各个参数可以用相似矩阵来表示。

实际结果中,加权交叉熵可以处理数据中的不平衡,效果比标准交叉熵要好。

在给定多个图片时,可以分析出相应的网络架构和损失函数,如下表所示。

有趣的是:

当要评估的图片数从1增加到10时,性能的增加非常明显。当图片在10个以上的时候,性能会变得趋向于稳定。

最终,研究团队选取了一个由 100 个不同的生成模型生成的 100,000 张Deepfake图片的数据库,每个模型生成了 1000 张图片。

其中部分图片用于训练模型,而其他图片则被保存,并作为来源不明的图片呈现给模型。

由于是第一次进行模型解析,没有现有的基线可供比较。

因此,研究团队通过随机设定ground-truth集合中的每个超参数,形成了一个称为随机ground-truth的基线。

结果表明,研究团队方法训练出的数据的性能明显优于随机ground-truth基线。

此外,实验中有来自100个生成模型的Deepfake图片集合,说明模型的选择具有代表性。

这也意味着在这种逆向工程的方法在人类和非人类的图片表现中都有很好的泛化能力。

研究人员:猫鼠游戏的本质不会改变

Hassner 将这项工作与法医技术(forensic techniques)进行了类别,该技术通过寻找所产生的图像中的模式,来确定照片是哪种型号的相机来拍摄的。

但他表示:

尽管不是每个人都能制作自己的相机,但是任何有计算机相关经验的人都可以制作他们自己的模型,生成Deepfake图像。

看来还真是个问题,那现在的检测技术发展得怎么样呢?

在Facebook去年举办的Deepfake检测比赛上,最后获胜的算法也只能实现对Deepfake软件 65.18% 的成功检测。

此外,每天都有新的AI技术出来,目前也没有任何检测系统可以同步得那么快。

因此,检测Deepfake这类生成模型制作的照片目前仍然是一个“未解决的问题”。

面对这种动态变化,Hassner说:

本质上,这是一个猫和老鼠的游戏,它将会一直继续下去。

是啊,技术的攻与防的游戏永远不会停止,伪造和检测的博弈也只会越来越好玩。

链接:
[1]https://www.theverge.com/2021/6/16/22534690/facebook-deepfake-detection-reverse-engineer-ai-model-hyperparameters?scrolla=5eb6d68b7fedc32c19ef33b4
[2]https://ai.facebook.com/blog/reverse-engineering-generative-model-from-a-single-deepfake-image/
[3]https://github.com/vishal3477/Reverse_Engineering_GMs
[4]https://arxiv.org/abs/2106.07873

推荐阅读

  • 【重磅】斯坦福李飞飞《注意力与Transformer》总结,84页ppt开放下载!

  • 分层级联Transformer!苏黎世联邦提出TransCNN: 显著降低了计算/空间复杂度!

  • 清华姚班教师劝退文:读博,你真的想好了吗?

  • 2021李宏毅老师最新40节机器学习课程!附课件+视频资料

  • 最强通道注意力来啦!金字塔分割注意力模块,即插即用,效果显著,已开源!

  • 登上更高峰!颜水成、程明明团队开源ViP,引入三维信息编码机制,无需卷积与注意力

  • 常用 Normalization 方法的总结与思考:BN、LN、IN、GN

  • 注意力可以使MLP完全替代CNN吗? 未来有哪些研究方向?

  • 清华鲁继文团队提出DynamicViT:一种高效的动态稀疏化Token的ViT

  • 并非所有图像都值16x16个词--- 清华&华为提出一种自适应序列长度的动态ViT

重磅!DLer-计算机视觉&Transformer群已成立!

大家好,这是计算机视觉&Transformer论文分享群里,群里会第一时间发布最新的Transformer前沿论文解读及交流分享会,主要设计方向有:图像分类、Transformer、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、视频超分、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。

进群请备注:研究方向+学校/公司+昵称(如Transformer+上交+小明)

???? 长按识别,邀请您进群!

能“看穿”换脸视频背后的AI模型相关推荐

  1. 能“看穿”换脸视频背后的AI模型,Facebook的反Deepfake方法有点东西

    本文转载自量子位. Deepfake是一款非常火的AI换脸工具,可以将专业复杂的AI换脸过程简单化,实现快速换脸,制作的内容甚至可以以假乱真. 但是,现在的技术不仅可以判断照片是否假冒伪劣,还可以跟踪 ...

  2. ai换脸h5换脸技术php,H5换脸视频背后的京东云技术十几秒内处理数万个换脸任务_联商网...

    眼下,基于人工智能技术的换脸软件火爆网络,换脸照片.换脸视频带给用户全新的互联网体验. 由人民日报新媒体联合京东AI.京东云推出的<70年,我是主角>H5换脸视频应用,在刚刚过去的国庆节期 ...

  3. 揭秘Deepfake换脸视频背后的技术细节

    导读:你一定看过很多换脸视频了,今天我们聊聊这些视频背后的技术--GAN. 作者:木羊同学 来源:大数据DT(ID:hzdashuju) 01 什么是GAN 今天聊GAN.这要从一个新闻说起,2020 ...

  4. 文本生成视频Make-A-Video,根据一句话就能一键生成视频 Meta新AI模型

    Meta公司(原Facebook)在今年9月29日首次推出一款人工智能系统模型:Make-A-Video,可以从给定的文字提示生成短视频. Make-A-Video研究基于文本到图像生成技术的最新进展 ...

  5. 各大短视频平台换脸视频背后的技术揭秘及deepfacelab教程

    1.抖音等各大短视频平台是如何进行换脸? 1.1 以前主流换脸框架 1.1.1 FakeAPP,是国内网络上广告最火的换脸软件,但是有水印,而且好像2.2版本还有极大的不安全后门,反正我早就不用了. ...

  6. CSDN日报190923:盘点那些被AI换脸、一键“脱”衣所滥用的AI模型

    CSDN日报来啦!给大家奉上当日最新鲜的技术干货! 人工智能|盘点那些被AI换脸.一键"脱"衣所滥用的AI模型 作者:beyondma 虽然笔者对于技术的滥用深恶痛绝,但技术本身是 ...

  7. 如何用 ModelScope 实现 “AI 换脸” 视频

    前言 当下,视频内容火爆,带有争议性或反差大的换脸视频总能吸引人视线.虽然 AI 换脸在市面上已经流行了许久,相关制作工具或移动应用也是数不胜数.但是多数制作工具多数情况下不是会员就是收费,而且替换模 ...

  8. “ZAO”火爆背后的AI换脸技术有多可怕?隐私泄露?法律风险?

    30日晚间,一款名为"ZAO"的换脸社交软件在朋友圈刷屏,不少科技圈人士坦言"刷了一整夜",而ZAO的创始人正好为陌陌总裁.首席运营官王力. 陌陌还推出了哈你. ...

  9. AI:百度飞桨EasyDL多门视频课程,手把手教你如何定制高精度AI模型

    AI:百度飞桨EasyDL多门视频课程,手把手教你如何定制高精度AI模型 目录 百度飞桨EasyDL多门视频课程,手把手教你如何定制高精度AI模型 百度飞桨EasyDL多门视频课程,手把手教你如何定制 ...

最新文章

  1. 24组8K真实路面材质贴图素材 VizPeople – Pavement Textures V1
  2. 中考考试的指令广播_明天FM105.2《朝朝早精神好》推出2017广州中考日特别报道...
  3. 用树状数组解决求区间最值的问题:hdu1754
  4. KS012基于SSM实现个人记账管理系统
  5. sqlerror.java.1055,at com.mysql.jdbc.SQLError.createSQLException(SQLError.java:1055)
  6. 栏目图片 栏目描述_网站描述怎么写?对网站优化有什么作用?
  7. timestamp 转换 mysql_技术分享 | MySQL:timestamp 时区转换导致 CPU %sys 高的问题
  8. Shell多线程实现
  9. 陶陶摘苹果(升级版)(洛谷-P1478)
  10. PHP仿金蝶云ERP进销存V8网络多仓版源码
  11. python监控服务器信息进行可视化_Python实现数据可视化,看如何监控你的爬虫
  12. iPhone X (XS XR XSMAX)如何根据状态栏上的图标 获取设备的联网状态(不是单个应用的)
  13. 阵列卡直通模式和raid模式_Dell R730服务器通过RAID在线扩容方法详解
  14. 太赞了!靠着这份面试题跟答案
  15. 什么是 480i、576i、480p、1080i、720p?什么是 HDTV?
  16. Unity shader 实现圆角矩形
  17. 2019小程序发展趋势
  18. 求两个数的 最大公约数 和最小公倍数
  19. 5G中传和回传的承载解决方案
  20. python-生僻字转拼音

热门文章

  1. springmvc前台String转后台Date
  2. php include request 区别
  3. ×××linux下samba服务器
  4. 流程管理精英沙龙活动(深圳站)圆满结束
  5. Ninject依赖注入——构造函数、属性、方法和字段的注入(三)
  6. 关于帧中继的点对点实验
  7. SVM讲的成体系的,自圆其说较好的一篇,上午没读完,KKT第二部分不等式有疑问没弄懂,复制后继续读完
  8. train_test_split()
  9. 0 到 1 的过往,1 到 10 的未来 | 智源两周年,开启新篇章
  10. 各方评论《面向儿童的人工智能北京共识》:这是中国人工智能发展轨迹中的一份关键文件...