悬赏百万美金,检测Deepfake假视频,数据集有470G:很久不见这么壕的比赛
点击我爱计算机视觉标星,更快获取CVML新技术
车栗子 发自 凹非寺
量子位 报道 | 公众号 QbitAI
谁说Kaggle比赛都那么穷?
穷不穷,还要看做的是什么任务。
比如,有左右两段视频,你能分辨哪个是修过的么:
动图结尾公布了答案,右是原始视频,左是Deepfake之后。
就算肉眼也很难分辨,如果有AI能够胜任,重金奖励也不奇怪吧:
刚刚,就有一场捉拿假视频的Kaggle挑战赛启动了,奖池总额高达100万美元。
这是Facebook联合亚马逊、微软、“AI伙伴关系”以及各路学者,一同举办的比赛。
参赛的AI不止观察画面是真是假,也要判断声音有没有修改过。
大概是人类很少见到百万美元级的比赛,这场新的挑战赛引发了强烈关注,6小时Reddit热度达到268点,一天过去已有600+热度:
怎样的比赛?
比赛的名字叫Deepfake检测挑战赛,简称DFDC。
这场挑战赛是怎么来的?
就像开头提到的那样,主要是Facebook在搞事情,并且早就开始酝酿了:
去年9月,Facebook发起了一项画风清奇的征集活动。他们呼唤各种各样的人类,打开电脑的前摄像头,或者手机的前摄像头,面对镜头讲出一些很平凡的事情。
于是,千千万万的小伙伴开始了自己的表演,卧室、走廊、后院都变成了他们的舞台。探讨的话题也天南地北,从垃圾食品有多危险,到艺术教育有多重要。
当然,Facebook提前向大家预告,会修改征集到的视频,也就是说每个上传作品的人类,都要同意成为Deepfake当事人。不论自己的脸换进别人的视频,还是别人的声音换进自己的视频。
后来那些视频,都成了比赛数据集的一部分:
数据集们
如果你仔细看了开头,可能会发现一个巨大的数字:训练集有470GB。
为了方便选手们下载和访问,善解人意的主办方把它分成了50个“小文件”,每个大约10GB。
当然,如果你的电脑够强大,也可以直接下载一个470GB的大文件。
鉴于数据集大到很难直接在Kaggle上使用的地步,官方强烈建议离线训练。然后把训练好的模型,加载为一个外部数据集放进Kaggle Notebooks里,再在测试集上跑推理。
除了训练集,比赛还提供了一个包含400段视频的验证集,可以下载。
接下来就是测试集,主办方做了两个测试集。一个是公共测试集,公开的排行榜就是由它决定的;另一个是私有数据集,它会排出一个不公开的排行榜 (代码提交截止之后才会揭晓) 。
规则详情
AI要检测出哪些视频是修改过的。为了衡量AI的检测能力,选手要把代码放到黑盒环境里测试。
报名比赛之后,每天只能提交两次,最终也只能选择成绩最好的两次来参赛。
2020年3月3日是加入比赛的截止日期,同意比赛规则以及组队,都必须在这之前完成。
2020年3月31日是提交模型的最后期限。
比赛前五名都有奖励:第一50万美元,第二30万美元,第三10万美元,第四6万美元,第五4万美元。
选手可以选择公开自己提交的模型,也可以选择不公开。但不公开的话,就没有领奖资格了。
重赏之下,必有勇夫。你是不是也有点小激动了?
回头看去
说起来,机器学习领域上一次刻骨铭心的百万美元级比赛,还是2006年的网飞奖 (Netflix Prize) 吧。
那时,Netflix豪掷100万美元悬赏一个算法,预测用户对电影的评分:只要比公司自己的Cinamatch算法提升10%,就能得到这比巨款。
2009年,奖金终于被一个名叫BellKor’s Pragmatic Chaos的团队抱走,他们开发的算法,比Netflix当时在用的系统,提升了10.06%。
但从那以后,同样慷慨的比赛就罕见了。
取而代之,奖池几万美元的Kaggle比赛越来越多。
甚至有小伙伴灵魂发问:
“为啥Kaggle比赛奖金那么少?”“主办方为什么那么抠?”
有人说网飞奖的时代,是刀耕火种的时代,而今ML算法门槛远没有那么高了。
这的确是事实,但会不会投入重金举办比赛,也不是这一个因素决定的。
在Deepfake盛行的今天,假视频越来越逼真,也让人类感受到了威胁,频频发出“以后什么都不能信了”的感慨。
而比起普通人,公众人物尤其受到假视频的侵扰。斯嘉丽·约翰逊 (俗称寡姐) 就曾经公开表达过:Deepfake小电影已经严重影响了她的生活。
为了明辨真伪,减少AI制造的虚假信息带来的伤害,自然要利用AI来回击假视频。
Facebook紧紧牵起亚马逊和微软的小手,让百万美元ML比赛重出江湖,也是为了给自家和别家的AI创造一个美好的发展空间,不要因为假视频泛滥而受到太大的阻碍。决心不可谓不盛。
最后复习一下各项奖金额度,这样你也会去参加一下吧:
比赛传送门:
https://www.kaggle.com/c/deepfake-detection-challenge/
竞赛学习群
关注各类计算机视觉、机器学习竞赛,技术交流、找人组队,扫码添加CV君拉你入群,如已为CV君其他账号好友请直接私信,
(请务必注明:竞赛)
喜欢在QQ交流的童鞋可以加52CV官方QQ群:805388940。
(不会时时在线,如果没能及时通过还请见谅)
长按关注我爱计算机视觉
悬赏百万美金,检测Deepfake假视频,数据集有470G:很久不见这么壕的比赛相关推荐
- 谷歌AI发布Deepfake检测数据集,真人多场景拍摄,生成3000段假视频
点击我爱计算机视觉标星,更快获取CVML新技术 本文转载自新智元(AI_era) . 新智元报道 来源:Google AI 编辑:大明 [新智元导读]Deepfake又添劲敌!这次出手的是谷歌 ...
- 重磅!谷歌刚刚发布Objectron新数据集,可完美检测3D目标,超过4百万幅图像和15K视频剪辑!...
点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 本文转载自:新智元 | 编辑:QJP [导读]谷歌人工智能实验室近日发布 Objectron 数据 ...
- 从奥巴马假视频到ZAO,换脸和人脸检测技术发生了什么?
点击我爱计算机视觉标星,更快获取CVML新技术 本文转载自机器之心. 选自Medium 作者:Ajinkya Khalwadekar 机器之心编译 参与:Panda.蛋酱 这是一篇不错的人脸操纵和检测 ...
- 一些用于拥挤场景的异常检测的视频数据集
UCSD Anomaly Detection Dataset http://www.svcl.ucsd.edu/projects/anomaly/dataset.htm UCSD(加州圣地亚哥大学分校 ...
- CVPR 2020 | 给Deepfake 假脸做 X-Ray,新模型把换脸图打回原形
机器之心报道 作者:思源 计算机视觉顶会 CVPR 2020 接收结果已公布,6656 篇有效投稿中录取了 1470 篇论文,录取率约为 22%.本文介绍了微软亚洲研究院的研究者被 CVPR 2020 ...
- 【CVPR 2020】给Deepfake 假脸做 X-Ray,新模型把换脸图打回原形
本文转载自机器之心(公众号ID:almosthuman2014),未经许可请勿二次转载. 计算机视觉顶会 CVPR 2020 接收结果已公布,6656 篇有效投稿中录取了 1470 篇论文,录取率约为 ...
- 向假视频宣战!研究人员开发出了鉴定假视频的“照妖镜”
选自:fastcompany 作者:Siwei Lyu 编译:网易智能 参与:小小 对于未经过特殊训练的人来说,很难分辨出深度假视频(Deepfake),因为它们可能非常逼真.无论是作为一种新型的&q ...
- BDD100K:最经典大规模、多样化的自动驾驶视频数据集
来源:HyperAI超神经 本文约1000字,建议阅读6分钟 目前,自动驾驶的公开数据集主要由视频和图片组成,近两年也增加了许多雷达数据.今天将介绍的数据集为加州大学伯克利分校发布的 BDD100K ...
- Facebook狂撒20万美元,悬赏用AI检测P图盗版问题
博雯 发自 凹非寺 量子位 报道 | 公众号 QbitAI 只要你能检测出右边这张图片与左边的原图相似,说不定就能拿走Facebook的10万美元(64万人民币)奖金! 而对于这场寻找相似图片的比赛, ...
最新文章
- 一张图解释SQL Server集群、镜像、复制、日志传送
- pytorch for循环性能对比
- 小工匠聊架构-分布式场景下的并发幂等性常见的解决方案
- 用 Python 一键分析你的上网行为, 看是在认真工作还是摸鱼
- 黑马程序员pink老师前端入门教程,零基础必看的JavaScript基础语法视频教程(二)
- mysql 函数重载_[赋值]函数,变量,重载 ,_第1页_169IT
- 洛谷 P2596 [ZJOI2006]书架 解题报告
- 源码包安装mysql_源码包安装MySQL
- 【转】同步的HttpClient使用详解
- 语音识别技术是什么 语音识别技术应用介绍【图文】
- Linux学习笔记一:vmware安装Ubuntu虚拟机并进行联网设置
- f和摄氏度怎么换算_华氏度和摄氏度的换算
- java实现将.acc格式转化为mp3格式
- 小高考三门计算机能报大专吗,江苏小高考没过能上大学吗
- 计算机型号或配置,新手必看电脑配置及型号含义速成!
- OpenLayers分屏联动对比
- 畅阳题库管理系统-在线考试(h5+小程序)Java开源版本
- 三面微软,四面雅虎,外企面经复盘总结,那些你不知道的面试技巧
- 四天搞懂生成对抗网络(二)——风格迁移的“精神始祖”Conditional GAN
- 金融行业的数据分析怎么做?
热门文章
- kaggle实战—泰坦尼克(三、数据重构)
- sql server链接远程服务器上的csv文件_批量监控联想服务器硬件状态工具
- native react 更新机制_React Native - 组件的生命周期详解(附:各阶段调用的方法)...
- matlab meshc函数_有那些相见恨晚的MATLAB绘图命令
- php socket 不能用,PHP无法用Socket方式连接MySQ
- 【Linux】Linux 中文出现乱码问题的解决
- oracle10g自带的公共同义词,Oracle10g实战教程第07讲视图、同义词、序列
- native react 更新机制_react-native热更新全方位讲解
- python tkinter 窗口禁止编辑_python tkinter禁用文本窗口中的换行
- c语言将数据写入文件后乱码_html文件的下载,如何使用字节流,如何使用转换流...