转自:新智元

看脸和声音是否匹配,这种黑科技如今走向了现实。中科院计算所23岁的博士生温佩松主导开发出一种「听音识人」的 AI 技术,只需1秒就能将声音和正确人脸进行匹配,准确率接近 90%。

「AI换脸」技术实际上蕴含着巨大的风险,只需上传一张照片,就可以让你的脸随着音乐蚂蚁呀嘿,欢乐的同时,也让人无从判断视频的真伪。

阿里安全图灵实验室的资深算法专家认为这项工作能够有效地降低伪造视频的风险,帮助公众进行辨别,保护用户的财产和信息安全。目前该研究成果已被 CVPR2021接收。

据温博士说,灵感来源于一个综艺节目,节目里川大教授听声音就可以判断长相。

经过调研以后,发现事情可行,当即开展了工作,主要研究方法就是找数据,搭模型。

主要创新点在于

1、引入一个两阶段模态对齐的损失函数,把局部信息和全局信息都引入进来

2、引入动态 reweighting 模式来发现不同对象之间的多样性

对于不同的匹配对来说,难度也是不同的(声优伪装?)。

主要的模型架构也是首先对face和voice分别进行编码,然后通过三个损失函数进行训练。

用到的数据集主要从VoxCeleb和VGGFace中构造。

道高一尺魔高一丈,如今声音也是可以通过模拟,例如高德导航的各种明星语音,也许未来还会有更强大技术的出现来对抗。

后台回复:voice 获取论文链接

重磅!DLer-AI顶会交流群已成立!

大家好,这是DLer-AI顶会交流群!首先非常感谢大家的支持和鼓励,欢迎各位加入DLer-AI顶会交流群!本群旨在学习交流人工智能顶会(CVPR/ICCV/ECCV/NIPS/ICML/ICLR/AAAI等)、顶刊(IJCV/TPAMI/TIP等)写作与投稿事宜。包括第一时间发布论文信息和公开演讲视频,以及各大会议的workshop等等。希望能给大家提供一个更精准的研讨交流平台!!!

添加请备注:AI顶会+学校/公司+昵称(如CVPR+上交+小明)

???? 长按识别添加,即可进群!

「蚂蚁呀嘿」克星来了!中科院23岁博士生开发「听音识人」,准确率近90%相关推荐

  1. 哈哈哈哈,16 岁高中生开发「粤语编程」项目,在 GitHub 火了!

    点击上方 "编程技术圈"关注, 星标或置顶一起成长 后台回复"大礼包"有惊喜礼包! 每日英文 Everyone wants to escape sometime ...

  2. 火了!16 岁高中生开发「粤语编程」项目

    来自:机器之心粤语编程语言 --The Cantonese Programming Language.看来大家都是 C 语言啊. 最近十分搞笑的饮茶梗,刷新了大家对粤语的认知.其实粤语一直都是一个隐含 ...

  3. 16 岁高中生开发「粤语编程」项目,在 GitHub 火了!

    点击上方"Github中文社区",关注 触达Github项目 来自:github中文社区 大家好!我是Huber! 好听的粤语都能编程了! 最近十分搞笑的饮茶梗,刷新了大家对粤语的 ...

  4. 「蚂蚁」狂奔!最高估值4600亿美金,或成今年全球最大IPO

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要5分钟 Follow小博主,每天更新前沿干货 [导读]最新报告显示,阿里巴巴旗下蚂蚁集团的估值提升至3800亿至4610亿美元,再创新高!近年 ...

  5. 如何在微信小程序上开发一个「蚂蚁森林」和「蚂蚁庄园」结合体?

    你在蚂蚁森林中种了几棵树? 你在蚂蚁庄园中捐赠了几颗蛋? 「蚂蚁森林」和「蚂蚁庄园」是支付宝分别在 2016 年 8 月和 2017 年 8 月上线的两个网上公益活动,通过游戏互动和激励来培养用户的低 ...

  6. 全网都在求的「蚂蚁呀嘿」教程--基于PaddleGAN的First order motion model实现

    什么?你还不知道「蚂蚁呀嘿」?这位兄台,那你可能out得相当严重! 这是引起男女老少的争相关注.火爆

  7. 用Python实现火爆全网的「蚂蚁呀嘿」!这也太恶搞了吧!

    最近在抖音上看到很多「蚂蚁呀嘿」的魔性视频,各方大佬齐齐上阵. 刚好看到百度的开源项目,基于PaddleGAN实现表情迁移,于是也来玩一把! 先来看一下小F的成果,各大编程创始人齐唱「蚂蚁呀嘿」! 没 ...

  8. 魔性,用 Python 实现火爆全网的「蚂蚁呀嘿」视频特效!

    完整文章.资料阅读公众号文章还有视频:https://mp.weixin.qq.com/s/RsJWPWKE0YCebelxHr-KaA 你好,我是悦创.这篇文章搞了前后两天,至于为什么搞,后面会说. ...

  9. 「蚂蚁金服」AntV年度发布

    回顾这一年 去年11月22日 AntV 品牌日,我们一起见证了__「G2」的开源__.「F2」的诞生.此后 AntV 团队从未停止过在数据可视化道路上的探索,得到了开发者们的信任和青睐. 除了收到大量 ...

最新文章

  1. python dataframe 分位数_Python pandas.DataFrame.quantile函数方法的使用
  2. JavaScript Switch 语句
  3. 笔试题:写一个ArrayList 的动态代理类
  4. java面试题十 string字符串操作
  5. java.lang.NoSuchMethodError: scala.Predef$.refArrayOps([Ljava/lang/Object;)[Ljava/lang/Object解决
  6. 安装distro ./test.sh 找不到路径
  7. 襄阳社区招聘计算机考什么时候,襄阳招聘网格员什么时候报名?
  8. linux环境下项目启动却访问不,在Linux环境下部署项目遇到的一些问题
  9. 添加简单的linux内核模块,操作系统实践 第12章-添加最简单的Linux内核模块.ppt
  10. 新春牛年迎春PSD分层模板!最全设计素材都在这了
  11. matlab在电气信息类专业中的应用,MATLAB在电气信息类专业中的应用(高等学校应用型特色规划...
  12. 免费漫画系统,漫城cms内容管理系统,免费原生app
  13. Android netd 简单分析和配置iptable
  14. Python WEB 开发,什么是 WSGI ?uWSGI、Gunincorn 都是啥玩意儿?
  15. 安卓开发用什么语言?Jetpack-MVVM-高频提问和解答,Android校招面试指南
  16. 谷歌Chrome浏览器的翻译按钮不见了
  17. 盘点40余款好用的项目管理软件
  18. 报表中的地图怎么做?
  19. Shell编程(week4_day5)--技术流ken
  20. 约数的和及约数的个数

热门文章

  1. Android 侧划菜单
  2. 2011年8月51CTO壁纸点评活动获奖名单【已结束】
  3. 重新编译php又出错了。undefined reference to `php_xx
  4. 日志分析工具 LogParser
  5. 计算机aoa综合题word,AOA-word综合题操作步骤(修正版)
  6. 第一篇:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xc3 in position 0: invalid continuation byt
  7. ndarray保存成文本
  8. pandas.Series.values 将Series内的数值以ndarray或ndarray-like的形式返回,取决于原Seires的数据类型
  9. 图灵访谈 | 王贝珊:乘风破浪的成长之路
  10. JavaScript武力值飙升!用TensorFlow.js轻松实现在浏览器里搞深度学习......