行早 发自 凹非寺
量子位 | 公众号 QbitAI

只需要演员五分钟的声音素材,就可以让他在电影里说另外一种语言?

在没看到这段视频之前我是不相信的,来听听这段效果如何:

这段视频取自《博多之子》(英文名Every Time I Die),是一部英文惊悚片。

但是我们在播放中可以看到,只需要一键点击,就可以在任意时刻把英语转换为西班牙语,并且听起来还是原演员的声音。

连说话中惊恐、颤抖的细节也忠实地继承了下来,给我们展示了一把AI配音的神奇力量。

当然,这波操作也不出意外地打动了许多投资人。

制作这段内容的公司Deepdub (深度配音),最近就在A轮融资中拿到了2000万美元。投资人中还包括福克斯电视工作室前总裁、Snyk的联合创始人、Meta的工程副总裁等。

AI配音冲击传统模式

AI 配音何以这么受期待呢?因为这其中蕴含了巨大的商机。

要知道,像在美国等地的英语观众是没有看字幕的习惯的。因此,面对一些非英语的优秀作品,他们有很强的本土化需求,也就是英文配音版本。

例如前段时间爆火的韩剧《鱿鱼游戏》,在首映28天内,总观看时间就达到16.5亿小时,加起来相当于18.2万年。一举成为Netflix史上排名第一的节目。

可是这么大一块蛋糕,从传统的角度来说,吃起来却相当费劲。

图注:《鱿鱼游戏》播放量,右栏第一排

例如,本地的发行商得花钱翻译剧本吧,得聘请配音演员扮演角色、租场地设备、完成大量的配音录制吧,最后还要把配音拼接到原视频中。

这里面还面临着很多文化差异。

这一套下来,按照行情怎么说也要15-20周。

而Deepdub的AI配音方法只需要原演员录制五分钟的随机文本,让神经网络学习演员的声音然后用另一种语言表达出来。

听起来就像原演员学会了另一种语言,并且时间上只用四周就可以完成相同的工作量,包括翻译、改编、混音等过程。

在技术细节方面,Deepdub没有公开太多,或许可以用在GitHub上大火的Mocking Bird做参考。

只需要五秒钟,就可以克隆任意的中文语音,再用同一音色合成其他语音内容,实现从语音到文本再到语音的过程。

模型结构主要由说话人编码器(Speaker encoder)、合成器(Synthesizer)和声码器(Vocoder)组成。

其中说话人编码器(绿色)负责提取说话人语音的特征向量,学习音色。

然后再执行传统的TTS(Text-to-Speech)环节:

在合成器(蓝色)中把语音特征融入指定文本,以梅尔频谱为中间变量,将生成的语音频谱传给声码器(红色)。

最后使用深度自回归模型WaveNet作为声码器,用频谱生成最终的语音。

不过,Deepdub虽没有透露自己的技术细节,但是他们声称已经在这个学术研究领域处于领先地位。

这么说也是有些可信度的,从他们的产品、获得的投资和兄弟创始人背景中也能看出来:

弟弟Nir Krakowski有25年的专业研发经验,哥哥Ofir Krakowski还曾在以色列空军机器学习部门任职……

AI配音赛道多家竞速

当然,看上这块市场的也不止Deepdub一家,只是策略上有些不同。

Deepdub走的是修改音频的路,视频内容原封不动。他们打算将用这轮融资的钱扩充团队的营销、研究和工程部门,并且正在和好莱坞谈合作。

英国公司Papercup采取的方法和Deepdub类似,也是专注于音频,通过机翻重新部署原演员的声音,使用合成声,保持视频不变。

而另一家Flawless在音频上还依靠配音演员,但是会编辑视频中的人脸和口型,看起来更像是在说目标语言。

像其他的,还有亚马逊等科技巨头也在做相关的研究,但是现在还没有产品出来。

这么看来,或许我们将来真的可以造出视频界的“巴别塔”,在网剧这块做到无障碍交流。

又或者,某些个别演员真的不用背台词了?

参考链接:

[1]https://techcrunch.com/2022/02/10/deepdub-raises-20m-for-a-i-powered-dubbing-that-uses-actors-original-voices/
[2]https://venturebeat.com/2022/02/10/deepdub-closes-fresh-financing-round-for-ai-that-dubs-movies-shows-and-games/

五分钟示范“教会”演员说外语,还可无缝切换语种,这家AI配音公司刚获2000万美元A轮融资...相关推荐

  1. Cloud一分钟 | 云存储服务商​Egnyte获7500万美元E轮融资,高盛领投

    Hello,everyone: 10月12日早,星期五,祝大家工作愉快! 一分钟新闻时间: 完 1.微信群: 添加小编微信:tangguoyemeng,备注"进群+姓名+公司职位" ...

  2. 1分钟链圈 | 快播创始人王欣成立区块链公司,获3000万美元融资

    Hi,艾瑞巴蒂! 这里是 9 月 5 日的每日1句话新闻晚报,只需1分钟,看看全球最热.最新的区块链新闻. 实时币价:BTC $7376.90    ETH $283.26    EOS $6.50( ...

  3. 一分钟AI | 腾讯市值超5000亿美元创亚洲最高!CV杀红脸了:AI国家队云从科技完成25亿B轮融资

    一分钟AI 人脸识别公司云从科技获25亿元融资,20亿来自广州市政府 云迹科技宣布完成数千万美元A轮融资 腾讯.海航共同领投 腾讯市值超5000亿美元,成亚洲市值最高公司 阿里巴巴28.8亿美元入股高 ...

  4. 三星带着Bixby搅局中国市场,还说自己是「一家AI技术公司」

    撰文 | 王艺 「到现在都不支持刷脸解锁的手机,还能叫旗舰机吗?」中国区 Bixby 开发总负责人张代君说,「三星在消费类电子技术厂商和半导体厂商之外,更是一家 AI 技术公司.」 11 月 21 日 ...

  5. 从抓包砍到接口测试,五分钟看完全过程解析,还说你不会测试?

    一.为什么抓包 1.从功能测试角度,通过抓包查看隐藏字段 Web 表单中会有很多隐藏的字段,这些隐藏字段一般都有一些特殊的用途,比如收集用户的数据,预防 CRSF 攻击,防网络爬虫,以及一些其他用途. ...

  6. 10.8亿元D轮融资,青云QingCloud五年三级跳

    企业级云服务商青云QingCloud (qingcloud.com)宣布完成金额为10.8亿元的D轮融资.本轮投资方包括招商证券国际.招商致远资本.阳光融汇资本.中金佳泰.泛海投资等多家机构,蓝驰创投 ...

  7. SNS游戏开发商五分钟获日本风投注资

    据网易科技报道,以"偷菜"知名的社交游戏开发商五分钟近日获得日本风险投资商注资,投资方称将帮助五分钟开拓日本市场.此前国内另一社交游戏开发商热酷进军日本大获成功. 此次五分钟投资来 ...

  8. AI一分钟 | 富士康押宝人工智能,将投资21亿元用于AI研发

    一分钟AI <西部世界>公布第二季首支预告:AI觉醒,向西部世界的人类发起反抗 机器人作家:2070年人体各部位都能被机器替换,你怎么看 DeepMind开发了一款眼底AI,可诊断三种常见 ...

  9. AI一分钟 | 传锤子和360手机正洽谈合并;吴恩达Woebot Labs完成800万美元融资;吴甘沙:AI技术中国排第二没问题

    整理 | 阿司匹林 一分钟AI 传360手机和锤子科技正在洽谈合并,目前尚未达成最终交易 IBM中国研究院研究总监称,AI统计数据发现夫妻俩一起生活可以降低心梗概率 驭势科技联合创始人吴甘沙表示,在A ...

最新文章

  1. php字符串转换表达式,php处理字符串格式的计算表达式
  2. python官网安装步骤-新手Windows下Python下载安装教程及配置注意事项
  3. 实现权限控制_Spring自定义注解+AOP实现权限控制
  4. Android下屏保程序的开发
  5. ftl 展示图片_视频号变迁的内容展示逻辑
  6. Kafka 为什么能那么快的 6 个原因
  7. 本地项目怎么推送到码云_【重谈npm】当下载一个项目到本地执行npm install报错时应该怎么办...
  8. 公司服务器文档管理制度,文件服务器管理制度
  9. Mysql高级-day02
  10. 华胜天成收购中天安泰10%股权 出手网络信息安全
  11. FTP客户端代码解析
  12. C++程序员爱的表白,心形图示例
  13. GitHub 爆赞的 RocketMQ 分布式中间件学习手册,竟一夜下载量破 10W+
  14. 整理:学术论文发表过程中的审稿人意见答复技巧
  15. linux下无论什么命令都command not fount
  16. 【问题解决】win服务器磁盘初始化
  17. 浅谈labviEW定时器
  18. Java JDK下载安装环境变量配置
  19. 【私人备忘录】Android P 去电代码流程
  20. 微信运营神器【运营小秘】封测邀请!

热门文章

  1. JavaScript中的instanceof运算符是什么?
  2. Cocoapods警告 - CocoaPods没有设置项目的基本配置,因为您的项目已经有自定义配置集
  3. “rm -rf”相当于Windows?
  4. 如何从字符串中删除最后一个字符?
  5. Python中递增和递减运算符的行为
  6. MyBatis 框架系列之基础初识
  7. 2016 VR年终大趴行业大佬齐聚,共同探讨AR、VR的商业化道路之变
  8. Android开发学习笔记:对话框浅析
  9. HTTP 2.0与HTTP 1.1区别
  10. Windows学习总结(3)——成为电脑高手必备的cmd命令大全