允中 发自 凹非寺
量子位 | 公众号 QbitAI

这年头,万物都可以是AI生成的,

从文字,到图片,亦或是目前火热的虚拟主播,

设想下,你在直播平台看到的虚拟主播背后,有可能是这样的画面。

连声音都可以是AI生成的,什么时候变声器已经能做到这个地步了,带着一丝震惊,我们深入了解了这款产品背后的技术团队,并得知了一个更加惊人的事实:

  • 免费使用

  • 仅需30分钟音频

  • 任何人就可复刻任何人声

这意味着在未来声音合成的门槛几乎为零,而这项技术是由国内一家年轻的AI初创公司格子互动自研的大饼AI变声,基于深度学习实现的声音转换(Voice Conversion)。

以往我们使用的传统变声器需要根据输入声源不断调整参数,而Voice Conversion可以提供更稳定的声音输出,让任何输入人声都高质量的转换成目标音色(Any to One)。

在Diffusion(图像)和GPT(文字)卷到飞起的同时,AI语音生成这片蓝海正在逐渐成为AIGC领域的下一个热点。

近期山东文旅宣布为旗下主持人海蓝生成了数字分身,并使用大饼声音引擎的产品为其定制了声音皮肤,引发了大量关注。

抑扬顿挫,委婉洒落。通过VC输出的声音极其细腻地还原了真人的语气、情绪和声音特征。

并且相较于非实时场景下对完整音频的声音转换,实时声音转换有着更加丰富的落地场景。在RTC领域,如直播、虚拟人等场景,变声的结果需要在很短的延迟内实时流式的生成,才能保证音画同步。

大饼团队针对这一点,通过对模型进行不断优化,使得实时转换延迟低于50ms,在实际使用过程中几乎感受不到。

大饼实时变声流程示意

大饼已经以插件形式登录声网云市场,在RTC领域受到了不少关注和讨论。

微信Steam都能用

目前,大饼变声已经适配了市面上大部分社交娱乐应用和游戏。

不仅可以接入到微信、腾讯会议等社交办公软件中,同样支持在英雄联盟、CSGO、狼人杀、Steam等游戏和游戏平台中同步使用。

无论游戏还是社交,都可以用各种声线来戏弄好友。

当然,这不一定是“大饼变声”最正确的打开方式…

一方面,变声带来了更丰富的可玩性和趣味性,另一方面,变声也保障了用户在线上社交时的隐私安全性,免去不必要的骚扰和歧视。

例如不少女性玩家曾经在玩游戏因为性别而被对手,甚至队友攻击,选择Carry角色却被认为不够格。

在线上游戏尤其是MMORPG等角色扮演游戏中,人们往往展现出和现实生活里截然不同的性格和人格,而这正是因为这些玩家游玩网络游戏的本质是希望在游戏里找到并扮演最完美、最理想的自己。

AI变声的出现可以让玩家在游玩过程中使用符合自己虚拟人设的声音皮肤,从而更好的带入角色,沉浸于游戏世界中。

就在6月2日,大饼推出了首个Windows实时变声客户端,用PC搜索“大饼AI变声”,即可前往官网免费下载试用。客户端内置丰富的音色选择,并且支持48k的高清音质输出。

拥有萝莉、御姐、正太等200+音色

我们上手体验了一番,无需任何前置调试,一键就能完成变声。

客户端演示

所以,这样一款好用易上手的AI变声工具背后究竟用到了哪些技术,而相比于以往传统的变声器,又有哪些不同呢?

AI变声将取代传统变声器

传统软件变声是对语音信号进行处理,通过改变输入声音频率,进而改变声音的音色、音调。

由于每个人的音色特征不同,需要不断调整声音参数,而这也难以保证输入音色效果稳定。

传统变声器的工作原理

而声音转换(Voice Conversion)是根据发声者的说话音频,将音频中的音色转换到目标发音人上,并保持说话内容、韵律情感等一致。将发声者的情感、抑扬顿挫、停顿等一并保留并输出:

输入样例—中文:

声音转换—中文:

换一种语言也能自然地转换,以日语为例:

输入样例—日语:

声音转换—日语:

通过AI输出音色相较于传统变声器,有几大明显的优势:

  • 能获得实时变声+声音克隆的效果,不需要使用者夹着嗓子发声,不需要因为声音不同而重新调试参数。任何人开启引擎,都可以实时稳定变声目标声音。

  • 并且在输出声音的质量上,也远远优于传统变声器。保留情感,抑扬顿挫的同时,支持多语种、方言的声音转换。

  • 并且AI变声不再需要物理机架以及声卡这些额外的专业设备支持,大饼自带虚拟声卡,保证了傻瓜式的操作流程,将使用门槛和成本降到了最低。

  • 不仅仅能换音色,还能消除口音,增强情感,甚至模仿各式各样的腔调。

事实上,不少科技大厂和巨头纷纷组建AI语音研究团队,朝着语音合成的方向暗暗发力。

大饼声音引擎,则是目前为止最集中在数字声音资产方向的生成式模型产品。其背后的AI初创公司格子互动,成立于2021年。

创始人凌天格是一位毕业于美国卡耐基梅隆计算机系的00后,团队的CTO徐颖则是前阿里巴巴语音算法专家,而CMO刘建俊曾任职于新浪、盛大及恺英网络VP,有多年的互联网经验。

这支新老搭档的团队在短短一年半的时间内前后获得源码资本奇绩创坛的两轮投资。

团队专注于声音领域,语音合成的研究与商业化。在AIGC还未成为热点的2021年就已经决定专注做声音的AI生成。而这个颇具魄力,在业内已经小有名气,极有“少年感”的团队,平均年龄只有26岁

短短半年时间,大饼变声引擎完成了多项技术的突破和上线,发布了PC实时变声客户端、以SDK形式登录声网云市场。

AIGC的价值就是把创作的门槛降到最低。试想在虚拟与现实逐渐交融的未来,每个人都可以免费、零门槛地拥有自己想要的声音,并在游戏、元宇宙等场景中使用符合自己虚拟人设的声音进行社交互动,自由开口,或许我们距离真正的“沉浸式”,又更近了一步。

用电脑搜索关键词“大饼AI”,立即前往官网免费下载体验;或点击阅读全文,了解更多大饼资讯。

30分钟音频当数据,任何音色零门槛生成,产品免费体验相关推荐

  1. Pyechart:30分钟学会pyecharts数据可视化

    30分钟学会pyecharts数据可视化 小红:你先跟我说说什么是pyecharts吧. 小明:Echarts 是一个由百度开源的数据可视化javascript库,凭借着良好的交互性,精巧的图表设计, ...

  2. MySQL 当前时间30分钟以内的数据

    MySQL 当前时间30分钟以内的数据 SELECT * FROM toa_machine_restart t WHERE t.END_DATE IS NOT NULL AND t.END_DATE& ...

  3. 如何设置(购物车或待支付账单)倒计时30分钟,数据库数据减少不?

    这实现起来方法很多,下面仅提供思路: 前台加后台,在创建订单时,添加额外字段,记录订单的创建时间.当用户进入此订单页面时就显示倒计时.前端获取当前时间,然后减去订单的创建时间,如果大于30分钟就取消订 ...

  4. 「合规」震惊!地图可视化竟能如此玩,零门槛,全免费,效果远胜主流作图工具!...

    在数据可视化领域,早晚会遇上地图可视化的需求,一个高大上的地图可视化,瞬间拔高整个报告的层次. Excel催化剂有幸接触并将地图可视化完全落地于Excel中完成.相对主流Python.R.PowerB ...

  5. 30分钟搞定数据竞赛刷分夺冠神器LightGBM!

    作者 | 梁云1991 来源 | Python与算法之美(ID:Python_Ai_Road) [导读]LightGBM可以看成是XGBoost的升级加强版本,2017年经微软推出后,便成为各种数据竞 ...

  6. pyechart 折线粗细_Pyechart:30分钟学会pyecharts数据可视化

    小红:你先跟我说说什么是pyecharts吧. 小明:Echarts 是一个由百度开源的数据可视化javascript库,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可.而 Python ...

  7. koa2 mysql增删改查_react+koa2+mysql零门槛的全栈体验,附上完整项目分享

    写在前面 本文适用于对后端开发领域较为陌生的初级前端开发小伙伴,如果你想一个人搞定一整个项目(服务端接口定义开发+前端页面渲染+数据库搭建+服务器搭建+部署上线),希望这篇文章能给你带来一点点参考价值 ...

  8. 零基础系统学习Maya(玛雅)软件,每天30分钟【软件精通】

    零基础系统学习Maya(玛雅)软件,每天30分钟[软件精通] 视频是分段播放, 免费教学,由于网站限制只能播放一集,想看全集教程的请移步哔哩哔哩搜索"3D建模云教室"观看 如果你一 ...

  9. tableau 集动作_Tableau训练营:7天,每天30分钟,零基础get数据可视化基本姿势

    原标题:Tableau训练营:7天,每天30分钟,零基础get数据可视化基本姿势 Tableau是啥?为什么要学? 「 强大的工具通常有一个共性,就是一旦你掌握了它,带给你的回报远远超过你当时付出的时 ...

最新文章

  1. PHP 获取当前类名、方法名、URL地址
  2. java tf值搜索_搜索引擎优化 TF_IDF之Java实现
  3. ceph osd跟cpu进行绑定
  4. 知乎热榜:如何获得高并发的经验?
  5. 【图表】java 24年发展历史及长期支持jdk版本(up to 2020.04)
  6. mac osx安装mysql5.7.9
  7. python自动测试n_接口自动化:Jenkins 自动构建python+nose测试
  8. jdk8分组统计字段和_JDK 8流和分组
  9. Python数据类型与运算符号
  10. java jtable不可编辑_java – 使JTable单元不可编辑
  11. 2021第一场教师招聘考试3.28开始!一个月备考来得及吗?
  12. 智慧屏鸿蒙系统简介,首发鸿蒙系统,荣耀智慧屏是何方神圣?
  13. 20200527每日一句
  14. js基础-5-数据类型,作用域,优先级
  15. 流氓软件mcafee之Mac端卸载
  16. Win10使用PowerShell命令行查看cpu温度
  17. 2022年重庆医院三基考试心血管系统疾病多选练习题及答案
  18. SideBar实现微信通讯录
  19. nbu客户端卸载_卸载NETBACKUP FOR LINUX
  20. Linux下优秀的翻译工具

热门文章

  1. Codeforces Round #819 C - D
  2. Go语言用GoPacket抓包分析
  3. 互联网产品——没有个性
  4. 【真人手势动画制作软件】万彩手影大师教程 | 水平、垂直翻转元素对象
  5. mp3格式怎么转换?这3种方法轻松帮你搞定!
  6. 一般报java.lang.NullPointerException的原因有以下几种
  7. ThreadPoolExecutor的shutDown和shutDownNow的区别
  8. Unity3D果汁店模拟经营完整项目工程源码
  9. 霸气!Nginx 中缓存静态文件秘籍
  10. 股票交易数据采集+数据可视化(一个朴素无华的Python爬虫+可视化案例,附代全部代码)