正文字数:1353  阅读时长:2分钟

Google最新推出的音频编解码器Lyra,不仅实现了以每秒3kb网络宽带提供听起来自然清晰的语音聊天,还可以在仅90ms延迟的情况下在从高端云服务器到中端智能手机的任何设备上运行。

文 / Teresa

2月25日,Google AI blog发布了一篇文章详细的介绍了最新推出的Lyra——一种用于语音压缩的新型超低比特率编解码器。该编解码器使Google Duo,以及未来的其他应用程序能够以每秒3kb的网络宽带提供听起来很自然清晰的语音聊天。

众所周知,人们对实时音视频的需求不断增加。特别是去年由于受到疫情的影响,许多人不得不隔离在家,只能与亲朋好友通过视频通话的方式保持联系。例如,仅去年一年Google Duo和Meet就承载了超过1万亿分钟的视频。而这些情况无疑是给全球的互联网基础设施带来了巨大的挑战。除此之外,虽然有些人可以使用一致的高质量,高速网络,但这种连接并不普遍。比如在网络通信并不发达的农村地区。然而,尽管在连接良好的地区,人们有时也会遇到质量差、带宽低的问题。那么如何在有限的带宽下实现高质量的音频输出就成为了目前最重要的议题。

Lyra音频编解码器 

因此,Google推出了一种高质量、低比特率的新型音频编解码器——Lyra。尽管用户在网速很慢的情况下,也能进行语音聊天。Lyra编解码器的基本结构体系非常简单,如上图所示。而Lyra与其他音频编解码器的不同之处在于:它利用机器学习模型,开发了一种新的模型,能够使用最少的数据来重建语音。这种模型不仅能够区分信号,还能生成全新的信号。与之相比,传统的参数编解码器只从语音中提取关键参数,然后用于在接收端重建信号。虽然实现低比特率,但得到的音频通常听起来很机械,不自然。而Lyra利用这些新的自然声生成模型,即能够保持参数编解码器的低比特率,同时又能实现高质量的音频输出。这与目前大多流媒体平台中使用的波形编解码器几乎不相上下。更重要的是,Lyra的效率足够高,可以在仅90ms延迟的情况下在从高端云服务器到中端智能手机的任何设备上运行。

与现有编解码器对比

Lyra目前被设计运行在3kbps情况下,听力测试表明,Lyra的表现优于任何其他编解码器。并且优于在相同8kbps情况下的Opus,从而实现了超过60%的带宽减少。Lyra可以在带宽条件不适合高比特率和现有的低比特率编解码器不能提供足够质量的情况下使用,这是它的一大优势,也是解决现在低音频质量的方案。

以下是Lyra与现有编解码器的对比:

 在安静的环境下:

Original 原始音频

Opus@6kbps

Lyra@3kbps

Speex@3kbps

 在嘈杂的环境下:

Original 原始音频

Opus@6kbps

Lyra@3kbps

Speex@3kbps

上方是Google提供的Lyra与Opus、Speex分别以6kbps和3kbps,对同一音频的压缩质量对比。能够明显感受到即使Lyra在3kbps情况下,自然语音音频的清晰程度也远优于Opus在6kbps下的情况。

适用情况

Google已经利用开源音频库对Lyra使用超过70种语言的扬声器进行了数千小时的音频培训,然后与专家和来自广泛的听众一起验证音频质量。Lyra在一个广泛的数据集中训练,包括大量不同语言的使用者,以确保编解码器能够应对各种情况。另外,Lyra还可以在云环境中使用,以方便使用各种网络和设备的用户能够无缝对接聊天。不仅如此,Google还将Lyra与新的视频压缩技术(例如AV1)配对后,即使用户通过56kbps拨号调制调节器连接到Internet,也可以进行视频聊天。

参考链接:

https://9to5google.com/2021/03/02/google-duo-android-lyra-voice-calls-2g-connection/

https://ai.googleblog.com/2021/02/lyra-new-very-low-bitrate-codec-for.html

AOM Summit 2021

我们在线上欢迎您的到来

北京时间:2021年4月8日

点击【阅读原文】了解详情

在3kbps的带宽下还能清晰地语音聊天?相关推荐

  1. Google Lyra Android版开源 支持3kbps语音聊天

    正文字数:1577 阅读时长:3分钟 Google Lyra Android版本今日开源,是否还会引发争议? 最新消息:Google于今日发布了Lyra音频编解码器Android开源版本. 据悉,开源 ...

  2. 华为手机业务网络推广外包持续受限,在当前市场下还能做些什么?

    日前据外媒报道称,美国政府现如今已经对华为智能手机业务市场作出限制将再延长六个月,而华为旗下网络推广外包业务产品中包括智能手机.移动宽带终端以及终端云等,其中华为智能手机凭借华为全球化的网络优势将华为 ...

  3. chrome浏览器win10下显示不清晰怎么办

    chrome浏览器win10下显示不清晰怎么办 win10字体不清晰怎么解决?下面是浏览器家园小编整理的不替换字体解决Chrome核浏览器在Win10下雅黑显示效果差的问题,一起来学习下吧. PS:本 ...

  4. 把图片放大后还很清晰的办法

    不知道在座的小伙伴们有没有遇到过这种绝望的时候,好不容易在网上下载到一张合适的图片素材,用来工作中使用,但是图片尺寸太小,将图片放大后却变得很模糊,没办法继续使用,只能继续寻找另外的图片素材.图片放大 ...

  5. 常见胸肌问题解答(五):下缘不够清晰

    常见胸肌问题解答(五):下缘不够清晰 胸大肌下外侧缘狭小.下胸部过分下坠或发达度不够,造成下缘清晰度不够,这样造成胸大肌在常态下整体轮廓不够清晰,胸大肌显得也不够饱满.坚挺.厚实. 以下来探讨几种可行 ...

  6. 怎么把图片文件大小压缩到25k到40k还比较清晰

    怎么把图片文件大小压缩到25k到40k还比较清晰 我们在网上报名上传照片经常会遇着这种情况:1.小两寸免冠照片 ,2.照片文件格式必须是.jpg ,3.文件大小必须在25K(25600字节)到40K( ...

  7. 几行代码就搞定一个文字识别功能,同时还能转换成语音,畅快!

    前几天想把一篇不错的文章保存下来,无奈是图片的,于是想利用python把图片中的文字识别出来 实现的方式还是挺多的,这里介绍下百度的AI开放平台,毕竟大公司,感觉识别的精度会高点,同时相信他们的算法也 ...

  8. C#下如何实现服务器+客户端的聊天程序

    C#下如何实现服务器+客户端的聊天程序 最近也在接触SOCKET编程,在当今这样一个网络时代,很多技术都以网络为中心在诞生,至少我认为是这样的,而SOCKET套接字接口,在实现网络通讯上处于关键地位, ...

  9. 支付宝,微信在没网络的情况下还能支付,是如何实现的?需要什么支持?

    上次,我去医院挂号的时候,在手机欠费没有网络的情况下,抱着试试看的心态打开了支付宝的付款码,挂号窗口的工作人员用扫码枪扫了一下,居然也扣款成功了.然后我就感觉很神奇,到底是怎么支付成功的.经过我咨询客 ...

最新文章

  1. /sbin/ifup: configuration for eth0 not found解决
  2. [转]《吐血整理》系列-顶级程序员工具集
  3. 桶分类 算法_桶分类算法
  4. (33)System Verilog模块与包定义同名类冲突
  5. 为什么在python中整数的值没有限制_为什么在Python中整数是不可变的?
  6. 全能电子地图下载器(免安装)
  7. 【Unity面试】 Unity基础核心 | 面试真题 | 全面总结 | 建议收藏
  8. ecshop批量打印快递单
  9. 图书租赁管理系统——数据流程图
  10. Mac vmvare vmdk文件使用
  11. 硬盘的种类及运行原理
  12. android检测蜂窝网络,Android 判断网络状态及开启网路
  13. 生产订单(prod order)状态直接从表(AUFK/JEST/TJ02T/TJ02)获取
  14. 互联网企业的盈利模式
  15. CSU_WF-中南大学网络服务队2020招新培训-硬件知识
  16. [DP优化之平行四边形不等式]例题
  17. 华东师范大学计算机组成原理教材,华东师范大学计算机组成原理.ppt
  18. 项目开发安全经验总结
  19. IDEA中快速添加自己自定义的方法方法,想要什么快捷方法都行
  20. 那一扇窗——倪张根自述创业心路历程

热门文章

  1. 位操作/获取数组的个数
  2. WEB 实时推送技术总结
  3. 人工智能热门图书(深度学习、TensorFlow)免费送!
  4. CentOS 7.4下使用yum安装MySQL5.7.20 最简单的
  5. Dump文件:线程dump和堆dump
  6. 专业的PDF组件Spire.PDF for .NET V3.9.124发布|支持图标布局
  7. 《C语言编程初学者指南》一1.9 本章小结
  8. 合法练习黑客技术?这15个网站也许可以帮到你
  9. SQLserver删除某数据库中所有表 方法 二
  10. 2.Knockout.Js(监控属性Observables)