本文经授权转载自机器之心(almosthuman2014),未经授权禁止二次转载与摘编。

本文约6000字,建议阅读10+分钟

DFDC数据集是目前最大的公开可用换脸视频数据集。

[ 摘要 ]前不久,Facebook 主办的 Deepfake 检测挑战赛(DFDC)落下帷幕。近日,Facebook撰文介绍了其构建的大规模 Deepfake 数据集 DFDC。

数据集经常存在有关版权、隐私方面的争议,而 Facebook 构建的这个数据集规避了这方面的风险,它包含的所有数据均获得图像所有者本人授权。

Deepfakes 是近期出现的一种直接可用的视频换脸技术。除了 Deepfakes 以外,目前还出现了大量基于 GAN 的换脸方法(而且还带有代码)。

这类技术给人们的隐私安全等带来了威胁。为了应对此类威胁,Facebook 创建了一个大型换脸视频数据集 DFDC 以支持 Deepfakes 检测模型的训练,并组织了 Deepfake 检测挑战赛。

该数据集的亮点在于,所有对象均同意数据集使用其图像或视频,并允许在数据集构建过程中对其数据进行修改

DFDC 数据集是目前最大的公开可用换脸视频数据集,包含来自 3426 名付费演员的 10 万多个视频片段。这些视频通过多种 Deepfake、GAN 和 non-learned 方法生成。

Deepfake 数据集的规模对比。不管从帧数还是视频数量来看,DFDC 数据集都比其他数据集大一个数量级

下面,我们来看 DFDC 数据集的构建过程和方法。

源数据

很多 Deepfake 或换脸数据集中的片段来自新闻或简报室等非自然环境。而且,视频中的人物可能压根就没授权数据集使用他们的面部图像或视频。

基于此,Facebook 没有使用公开可用的视频来构建数据集,而是先向一些个人获得录制视频、将视频用于构建机器学习数据集,以及使用机器学习模型处理他们的面部图像的授权,进而得到了一组视频。

为了反映 Deepfake 视频对非知名人士造成的潜在伤害,该数据集中的视频均在没有专业打光或化妆的自然环境下录制。不过视频录制使用的是高分辨率摄像机。

该数据集中的源数据涉及:

  1. 3426 名对象,每个对象平均录制 14.4 个视频,大部分视频的分辨率为 1080p ;

  2. 48,190 个视频,每个视频的平均长度为 68.8 秒,共计长度 38.4 天;

  3. 原始数据超过 25 TB。

下表展示了不同 Deepfake 数据集的量化对比情况:

从中我们可以看出,DFDC 数据集的规模最大,涉及到的对象数量最多,且获得所有对象的授权。

数据集创建者使用内部人脸追踪和对齐算法对源视频进行预处理,将所有人脸帧剪裁、对齐,并将大小重新调整为 256x256 像素。

数据集创建过程中用到的换脸方法

该数据集使用多种方法生成换脸视频,这些方法涵盖了数据集创建时最流行的一些换脸技术。每种方法生成的视频数量并不均等,生成最多换脸视频的方法是 Deepfake Autoencoder (DFAE)。

具体而言,DFDC 数据集创建过程中使用的换脸方法包括:

  • DFAE:Deepfake 自编码器(DF-128、DF-256),数据集创建过程中使用模型的输入 / 输出分辨率为 128x128 和 256x256。

  • MM/NN face swap:使用基于自定义帧的 morphable-mask 模型进行换脸。

  • NTH:在 few-shot 和 one-shot 学习环境下,生成逼真的说话人头部 [31]。

  • FSGAN:使用 GAN 进行换脸 [20]。

  • StyleGAN:参见《英伟达再出 GAN 神作!多层次特征的风格迁移人脸生成器》。

  • Refinement:对混合后的人脸使用简单的锐化滤波器可以极大地提升最终视频中的感知质量,且几乎不需要额外的成本。

  • audio swapping:使用 [22] 中的 TTS Skins voice conversion 方法进行音频转换。

不同方法生成人脸的质量参见下图:

数据集构成

训练集:训练集包括 119,154 个十秒视频片段,涉及 486 个不同的对象。其中 10 万个视频包含 Deepfakes 内容,也就是说数据集中 83.9% 的视频为合成视频。这些 Deepfakes 视频通过 DFAE、MM/NN face swap、NTH 和 FSGAN 方法生成得到,且未使用任何数据增强。

验证集:验证集是 DFDC 竞赛中用于计算排行榜位置的公共测试集。该数据集包含 4000 个十秒视频,其中半数(2000 个视频)包含 Deepfakes 内容。验证集共涉及 214 个不同的对象,且与训练集并不重合。此外,该数据集使用的 Deepfakes 生成方法相比之前多了一项——StyleGAN。该数据集中大约 79% 的视频应用了数据增强技术。

测试集:私有测试集包含一万个十秒视频。与公共测试集一样,其中一半为 Deepfakes 视频。但是,二者的区别在于,私有测试集中一半视频来自网络,另一半来自源数据。

读者可以在以下地址查看 DFDC 竞赛使用的数据:

https://www.kaggle.com/c/deepfake-detection-challenge/data

数据增强

Facebook 团队使用多种数据增强技术,如几何变换或干扰等。主要的增强方法如下所示:

  1. 干扰:将各种物体(图像、形状、文本等)叠加在视频上;

  2. 增强:对视频应用几何变换、颜色变换、帧率更改等。

数据增强示例参见下图:

论文链接:

https://arxiv.org/pdf/2006.07397.pdf

编辑:黄继彦

10万视频,所有面部图像均获授权,Facebook创建大规模Deepfake数据集相关推荐

  1. 10万视频,所有图像均获授权,Facebook创建大规模Deepfake数据集

    2020-06-22 13:00:11 前不久,Facebook 主办的 Deepfake 检测挑战赛(DFDC)落下帷幕.近日,Facebook撰文介绍了其构建的大规模 Deepfake 数据集 D ...

  2. 陈松松:三种方式教你打造一个行业内10万视频播放量

    这是我写的第82篇原创视频营销文章 陈松松,6年视频营销实战经验 在任何一个行业内, 判断一个视频受不受欢迎, 不管是谁,第一个想到的就是视频播放量. 你的视频播放量高, 哪怕你的视频内容讲的不咋好, ...

  3. 10万奖金!探索图像盲降噪新方式,旷视2022 MegCup炼丹大赛等你来战

    关注"旷视研究院"公众号 获取比赛最新详情吧!

  4. 10万人的1000万张图像,微软悄然删除最大公开人脸数据集

    作者 | 神经小姐姐 转载自HyperAI超神经(ID:HyperAI) 前几日,微软静悄悄地删除了一个公开的名人图片数据集.这个本为世界上最大的公开人脸识别数据集,现在已经不能通过微软的渠道访问. ...

  5. 一条视频涨粉10万+,情侣账号如何实现流量、变现两不误?

    回顾过去一年快手最热门的短视频,除了乡村题材外,能常驻热门的就是爱情类短视频了. 据<2021快手婚恋内容生态报告>数据显示,2021年快手上爱情相关视频的条均播放量同比上涨77.62%, ...

  6. 视频聊天创企Tribe获300万美元种子轮融资

    视频聊天创企Tribe获300万美元种子轮融资 责任编辑:editor006 作者:双双编译 |  2016-10-13 21:58:46 本文摘自:猎云网 视频通讯聊天公司Tribe今天宣布获300 ...

  7. 冠军奖10万日元+10公斤柠檬!一个简单的柠檬图像分级竞赛

    ●赛题介绍● 该比赛来自日本算法竞赛网站signate. 参赛者需要构建一个算法,对柠檬的外观进行检测,并根据下面图像中的规则对柠檬的外观进行分类,分为4个等级. 0:优秀,1:良好, 2:加工产品, ...

  8. 一条视频涨粉10万,在快手引来千万人围观的“jio”有什么魅力?

    国庆期间,一双"卡通jio"在快手火了. 视频中的主人公是快手达人「糯米佳佳QVQ」,目前在快手的粉丝数已经达到169万,账号更新的视频内容基本都是洛丽塔.JK制服.汉服这三个被江 ...

  9. 视频号播放量破10万,这6招帮你上热门!

    第一,使用冷启动,懂得关系社交的核心. 冷启动是在视频号运营完全没有准备规划的时候,直接通过微信功能里的信息群发功能,轰炸式的发布通知信息.[目前不能直接发视频号的链接] 你会说这样的操作很老套,也招 ...

最新文章

  1. 从 C++ 到 Objective-C
  2. Ubifs文件系统和mkfs.ubifs以及ubinize工具的用法
  3. python中的apply(),applymap(),map() 的用法和区别
  4. 首批唯一!阿里云视频直播服务获信通院首批唯一认证
  5. Ubuntu 系统目录结构
  6. SQL Server 2017 AlwaysOn AG 自动初始化(七)
  7. Java中Link,set 和Map的区别,ArrayList,HashSet和HashMap的区别。
  8. ambari 搭建hadoop大数据平台系列4-配置ambari-server
  9. 【网络协议】IPV4协议介绍
  10. 体检预约系统软件测试计划书,体检中心-管理软件需求分析.doc
  11. Mybatis(一) 主配置文件
  12. 唯品会web前端实习生一面二面经
  13. 计算机系统结构——量化研究方法(第三版)
  14. UE4--材质地形篇——地形材质的运用(混合材质)
  15. UVALive 4126 Password Suspects(AC自动机+dp)
  16. html界面等待状态,html页面Loading效果实现:加载新页面前的等待过渡画面
  17. 网络安全——技术与实践(第3版)课后题答案
  18. NBIOT-BC28模块程序操作接口编写(基于STM32F103ZET6)
  19. mysql如何进行算术运算_MySQL教程53-MySQL算术运算符
  20. Java图形化界面编程超详细知识点(7)——进度条

热门文章

  1. jQuery 淡入淡出
  2. 分布式服务治理框架Dubbo
  3. 《实现模式(修订版)》—第1章1.2节那么,现在……
  4. 数据结构--KMP算法总结
  5. canvas刮奖效果
  6. cocos2d-x 3.0 Loading界面实现
  7. Audio Streamer
  8. linux下使用inotify实时监控文件变更,做完整性检查
  9. 【转】ASP.NET中“字母和数字混合的验证码”详解
  10. 网站留言板防重复留言_如何做一个2000年风格复古的个人网站(3)创建个人小站-主页...