Lyra——开启下一个十亿用户的语音通话

前言

过去的一年已经表明,在线交流对我们的生活至关重要。无论你身在何处、可用的网络条件如何,清楚地了解彼此之间的联系变得前所未有地重要。因此,我们在2月推出了Lyra:一种革命性的新型音频编解码器,它使用机器学习的优势来产生高质量的语音呼叫。

为了使通用的最佳编解码器普遍可用,我们开放了Lyra的源代码,使其他开发人员可以为其通信应用程序提供支持,并朝着强大的新方向发展Lyra。此版本提供了开发人员使用Lyra进行音频编码和解码所需的工具,Lyra已针对64位ARM安卓平台进行了优化。我们希望与社区一起扩展此代码库并开发对其他平台的改进和支持。

01 Lyra的体系结构

Lyra的体系结构分为编码器和解码器两部分。当有人在电话里讲话时,编码器会从他们的语音中捕获独特的属性。这些语音属性(也称为特征)以40ms的块提取,然后压缩并通过网络发送。解码器的工作是将功能转换回可以在听众的电话扬声器上播放的音频波形,通过生成模型将特征解码回波形。生成模型是一种特殊类型的机器学习模型,非常适合从有限的功能中重新创建完整的音频波形。Lyra架构与传统的音频编解码器非常相似,传统的音频编解码器已经成为互联网通信的骨干力量,已有数十年的历史了。这些传统的编解码器基于数字信号处理(DSP)技术,而Lyra的主要优势来自生成模型重建高质量语音信号的能力。

02 Lyra对未来音频的影响

在过去十年中,尽管移动网络持续稳步发展,但移动设备运算能力的爆炸性增长依然超过了可靠的高速无线基础架构的处理能力。对于存在这种反差的地区,尤其是发展中国家,下一个十亿互联网用户将上网,这种技术将使人们之间的联系更加紧密的希望仍然渺茫。即使在连接高度可靠的区域,异地工作和远程办公的出现也进一步限制了移动数据的限制。虽然Lyra可以将原始音频压缩到3kbps的质量,从而与其他编解码器(例如Opus)相比质量不错,但它的目标不是成为一个完整的替代方案,而是可以在这种情况下节省有意义的带宽。

这些趋势为Lyra提供了动力,也是我们的开放源代码库专注于其实时语音通信潜力的原因。我们认为还有其他应用,Lyra可能特别适合,例如,存档大量语音,通过利用计算便宜的Lyra编码器节省电池,缓解紧急情况下,许多人同时打电话的网络拥塞。我们很高兴看到开源社区以Lyra闻名于世,以提出更独特,更具影响力的应用程序。

03 Lyra的开源版本

Lyra代码使用C++编写,以实现速度,效率和互操作性,并使用带有Abseil的Bazel构建框架和用于全面单元测试的GoogleTest框架。核心API提供了用于在文件和数据包级别进行编码和解码的接口。还提供了完整的信号处理工具链,其中包括各种滤波器和变换。我们的示例应用程序与Android NDK集成在一起,以展示如何将本机Lyra代码集成到基于Java的android应用程序中。我们还提供了运行Lyra所需的权重和矢量量化器。

我们今天将Lyra作为Beta版本发布是因为我们希望使开发人员能够获得尽快的反馈。因此,随着开发的深入,API和比特流很有可能会发生变化。除数学内核外,所有运行Lyra的代码均根据Apache许可开放源代码,为此提供了共享库,直到我们可以在更多平台上实现完全开放的解决方案为止。既然Lyra是开源的,我们期待看到人们对Lyra的处理。在GitHub上查看代码和演示,让我们知道您的想法以及打算如何使用它!

拍乐云一直关注RTC前沿技术的最新动向,致力于探索行业用户在实时互动场景中的痛点解决方案,为用户提供强互动、沉浸式的音视频体验。也欢迎更多对音视频技术感兴趣的朋友能与我们交流,共同敲开未来RTC之门。

文 / Andrew Storus & Michael Chinen - Chrome

原文链接 / https://opensource.googleblog.com/2021/04/lyra-enabling-voice-calls-for-next-billion-users.html

译者 / 拍小编

Lyra——开启下一个十亿用户的语音通话相关推荐

  1. Lyra:助力下一批十亿用户的语音通话

    文 / Andrew Storus 和 Michael Chinen (Chrome) 在过去的一年里,在线通信已表明对我们生活有多么重要.无论您身处何地,也无论网络条件怎样,在线沟通时清晰理解彼此的 ...

  2. 三翼鸟,用两年开启下一个十年

    这段时间以来,我和亲朋好友的居家生活时间都增加了,以前一直存在但被忽视的不便体验,也开始凸显出来. 比如在家就餐频次高了,厨房小白会为不会做饭而苦恼:智能设备的很多功能,依然需要手动操作--这些琐碎的 ...

  3. 2016版excel_开启下一个十年,全新 Microsoft 365 订阅版终于来了!

    微软在 4 月 21 日在中国市场正式推出 Microsoft 365 个人版及家庭版订阅服务.Microsoft 365是 Office 365 的升级版,而Microsoft 365仍然是基于 O ...

  4. 和达摩院深度绑定,阿里云下一个十年,成为“云上的阿里巴巴”

    参加 2019 Python开发者日,请扫码咨询 ↑↑↑ 整理 | 非主流 出品 | AI科技大本营(ID:rgznai100) 2009 - 2019,阿里云已经走过了 10 年时光. 在此次的阿里 ...

  5. 北大校友马里千:计算机视觉商用的下一个十年,AI 生成应占有一席之地

    导语:近几年,人工智能在国内的商业落地趋于同质化,以识别与检测为主.当人们谈论AI创业,首先想到的总是以感知技术为代表的"AI四小龙"(商汤.云从.依图.旷视).除了感知,人工智能 ...

  6. 张亚勤、韦乐平等综述论文:通信人工智能的下一个十年

    来源:专知 [摘 要]移动通信技术走过了37年的发展历程,人工智能技术也已走过了64年的发展历程.从早期的各自独立演进,到5G与人工智能开始深度融合发展,"5G与人工智能"已被业界 ...

  7. 为什么下一个十年的主战场在 Serverless?

    作者 | 不瞋  阿里云 Serverless 负责人 "唯有超越,才能让我们走下去." 这是不瞋在阿里的第十年.从 2010 年加入阿里云,不瞋参与了阿里云飞天分布式系统的研发, ...

  8. 为什么下一个十年的主战场在Serverless | 云原生Talk

    简介:今天我们推出了一个新的栏目「云原生Talk」,聚焦云原生时代下,企业数字化转型的路径和实践方法.站在2020年这个节点,有太多企业数字化转型的故事值得被记录,无论是互联网与科技企业,还是(新)零 ...

  9. 为什么说下一个十年的主战场在Serverless?

    作者 | 不瞋,阿里云 Serverless 负责人 "唯有超越,才能让我们走下去." 这是不瞋在阿里的第十年.从2010 年加入阿里云,不瞋参与了阿里云飞天分布式系统的研发,历任 ...

最新文章

  1. 串口服务器怎么测信号,串口服务器如何调试
  2. 设计师电脑推荐笔记本_笔记本电脑选购推荐全攻略
  3. C#开发 —— 基础知识
  4. 程序员常用编程工具: VS Code,那些你不得不知道的小知识!
  5. [转]MFC子线程更改图像数据后更新主窗口图像显示方法
  6. 使用 Zabbix 监控 Jenkins
  7. 在WinForm程序中读写系统配置
  8. php微信公众号登录
  9. 华为数通网络自动化开发学习笔记
  10. 一则两年前的可怕预言:2013年中国经济危机将爆发!
  11. 2021年茶艺师(中级)考试及茶艺师(中级)考试题
  12. leopard 全部搞定状态截图
  13. Unity3D插件 Doozy UI 学习(二):与DoozyUI的事件传递
  14. FPGA中高时钟频率计数器设计
  15. Autofill安装使用
  16. 微信公众号更新缓存问题--批量添加版本号
  17. python 计算股票保本卖出价格
  18. html盒子模型图片居中,html学习笔记(img+body+盒子模型+块级元素居中+margi塌陷+float+文字围绕、打点)...
  19. (三)模电不归路之稳压二极管
  20. vue 使用高德地图点击标记点以及经纬度转地理位置

热门文章

  1. 永安在线API安全管控平台正式发布,以情报建立API安全基线
  2. 八块腹肌:硅谷程序员的新标配
  3. 苹果注定要输给欧盟,USB-C成为标准接口已是大势所趋
  4. (一)ssh远程连接服务器GPU以及其他GPU使用途径——新手指南
  5. CMOS电平的频率限制为什么一般在200M以内
  6. TreeView 入门
  7. Java词向量比较字符串相似度_Sequence Model-week2编程题1-词向量的操作【余弦相似度 词类比 除偏词向量】...
  8. USDP使用笔记(七)使用Flink1.14.3替换自带的老版Flink1.13
  9. oracle asm登陆实例,Oracle ASM实例介绍
  10. 电机驱动芯片——TLE9183QK