Instagram始终以高质量的体验为目标开发和优化应用程序,而优化Instagram体验的其中一种方式就是提高音频质量。

文 / Chris Hsu

译 / 蒋默邱泽

原文

https://instagram-engineering.com/improving-instagrams-music-audio-quality-284e555102e9

Instagram在形成有意义的社区方面起着至关重要的作用,这是因为人们可以在Instagram上相互联系彼此并分享对他们来说最感兴趣的事情。为了帮助更好地促进这些联系,我们始终以高质量的共享体验为目标来开发和优化应用程序。这让我们引以为豪:)优化Instagram体验的其中一个方法就是提高音频质量。

Instagram的音乐贴歌单给出流行音乐建议

什么是音频质量?

音频质量就是衡量我们提供给Instagram App的音频与原始未经过压缩的音频的匹配程度,一般情况下Instagram提供压缩后的音频,可实现音乐、视频的流畅播放,减少缓冲造成的停顿。

但是为了实现更流畅的播放,可能会带来压缩失真的后果。一些压缩失真的例子:高频声音的清晰度降低、低音减弱以及产生噪音。这些共同的差异同时降低了听众感知的音频质量。

提升音频质量

Instagram的视频系统可以访问多种级别的音频质量,而音频编解码器如何选择采样率和码率会影响到音频编码的质量。

不同的音频编码器具有不同级别的(有损压缩[1]),它们在不同类型的内容上表现不一。鉴于Instagram内容的规模和范围,严格评估编码器最适合的内容,并跟踪音频质量相关指标非常重要。但我们不可能将大量实验工程实际应用于监测音频质量指标,所以我们采用最简单的解决方案:通过现有的参与度指标来证明Instagram的听众关心音频质量,改变音频编码器并不是一项简单的内容。因此我们决定将保留AAC编码器作为我们改进音频质量的实验编码器。

采样率会影响我们的音频编码并可以正确表示频率上限,奈奎斯特·香农采样定理[2]说:”若是波形的采样速度是最高频率成分的两倍,那么可以对带状有限连续信号进行采样的并从样本中完美重建。“Instagram使用行业标准44.1kHz采样率,超过大多数人可以听到的最大20kHz,所以我们会排除变化的采样率变量。

码率以千比特每秒(kbps)为单位测量音频文件中线性变化。换句话来讲更高的码率意味着音频编码中更多数据和更少压缩。这样低压缩可以保留原始文件中更多特性,同时具有更少的压缩失真。当码率太低时编码器会剔除它认为不太重要的音频细节。由于我们采用音频编码和采样率不变,并且改变码率很容易事情;所以实验中我们变化了很多音频码率改进。

码率实验

在内部音频质量改进之前,Instagram对视频中音频默认码率为64kbps。手机的麦克风不会产生丰富的音频信号,尽管码率较低;但Instagram音频压缩对大多数内容表现还算不错。随着Instagram创作者发布录音室的音频内容时(例如录制音乐),明显64kbps达不到高质量音频。

我们收到一些艺术家报告反馈称Instagram音频听起来“爆裂”或者质量太次的某些歌曲。我们立即观察测试Instagram到压缩控件中现象;例如:音乐帖故事中一些小鼓、镲片以及声音混响的压缩音频听起来比原始录音更生硬和空洞。

很遗憾我们不能单纯的为所有内容增加码率,由于总带宽限制。如果我们在音频和视频之间分配带宽,这只不过是一个零和游戏。高质量视频的码率非常高对于64kbps和128kbps的音频之间的差异对回放内容影响可以忽略不计。但是在低带宽情况下,我们一定会用低得多码率提供视频这种情况下回放内容体验64kbps时候会产生很差的音乐感觉。

虽然我们可以提高音频码率,但我们必须平衡音频质量和视频质量之间的权衡。增加所有内容的码率是特别危险的,因为我们知道大多数内容都有简单的音频,并且不会从音频方面的权衡中获益。在我们的实验中,我们的目标是为正确的内容做出正确的质量权衡。

特定内容和社区质量的偏好

为了找到关于Instagram听众对音频信号质量偏好的凡响,我们考虑了提高音频质量的方法。从我们之前关于视觉质量的实验中,我们知道体验的质量是主观的,并且是内容类型和社区类型所特有的。

音频质量灵敏度取决于每个听众对音频细节的关注以及播放器材的质量(例如默认音响设备或耳机)。我们担心一些使用低端手机扬声器的Instagram用户可能不会关注一般的音频质量。另一方面,音乐家们知道Instagram是一个他们可以创建音乐社区的平台,所以我们怀疑很多Instagram的听众会对音乐的音频质量很敏感。

我们更希望看到音频质量与Instagram音乐内容参与度之间的相关性最强,因为Instagram的音乐内容的音频范围很广,也很丰富。为了得到这个信号,我们对产品进行了有针对性的音频质量改进测试,我们希望音频质量对产品产生最大的影响:音乐贴故事。

来自Relient K音乐贴 播放歌曲Cat

音乐贴故事实验

为了避免非音乐内容的稀释,我们利用Instagram视频和音乐编码标签系统来放大A/B测试中故事类型音频编码。控制组中所有的音频编码都使用默认的64kbps码率。我们运行两个测试组:一组编码使用96kbps,另一组音频使用128kbps码率。

在实验结果中,我们看到通过提高音乐贴纸故事的音频质量,用户的参与度明显提高。128kbps测试组提供了最佳的结果。我们通过观看时间(即观看视频所花费的时间)和查看百分比衡量视频参与度(即观看者看完视频的百分比)。尽管在视觉质量和重新缓冲方面出现了倒退,但观看时间和查看百分比都有所提高。

我们预计到视觉质量和缓存会让体验退化,因为我们将带宽使用从视频转移到音频部分。但是参与度指标超出了我们的预期。这些指标表明即便是播放性能下降,Instagram观众也还是愿意观看完整音乐贴视频故事,因为音频质量更引人入胜。

未来的变化

Music Sticker Stories增加了音频码率只是为Instagram群体提供个性化视频内容体验的开始。为了帮助我们在音频质量、视频质量和流畅度之间做出正确平衡,我们正在考虑构建基于感知音频ABR(即自适应码率)和内容识别(即识别哪些视频内容具有音乐元素)的未来计划。

参考

  • [1] 有损压缩 https://en.wikipedia.org/wiki/Lossy_compression

  • [2] 奈奎斯特·香农采样定理

    https://en.wikipedia.org/wiki/Nyquist%E2%80%93Shannon_sampling_theorem

LiveVideoStack  招募

LiveVideoStack正在招募编辑/记者/运营,与全球顶尖多媒及技术专家和LiveVideoStack年轻的伙伴一起,推动多媒体技术生态发展。了解岗位信息请在BOSS直聘上搜索“LiveVideoStack”,或通过微信“Tony_Bao_”与主编包研交流。

点击【阅读原文】或扫描图中二维码,即刻了解更多大会讲师及分享内容信息!

Instagram:如何提升音乐音频质量?相关推荐

  1. RTC 音频质量评价和保障

    导读:随着 5G 网络的普及以及疫情带来的影响,人们对实时音视频技术的应用场景会越来越多,包括会议.连麦.音视频通话.在线教育.远程医疗等,这些实时互动场景对 RTC 音频的质量提出了越来越高的要求. ...

  2. 音频频率和体验知识汇总-【音频质量专题】

                                 音频频率和体验知识汇总-[音频质量专题] 主要内容: 一.乐器人声频率知识 二.美声-各频段处理方式 三.各频段特点与评价术语 部分内容来源于 ...

  3. 浅谈语音质量保障:如何测试 RTC 中的音频质量?

    简介:日常音视频开会中我们或多或少会遭遇这些场景:"喂喂喂,可以听到我说话吗?我听你的声音断断续续的","咦,我怎么可以听到回声?","太吵啦,我听不 ...

  4. 对校招生培养工作的建议_如何提升人才培养质量?西华的老师们正面临一场大考...

    原标题:如何提升人才培养质量?西华的老师们正面临一场"大考" 西华大学招生 假期即将来临 而你的学院和老师们正面临一场"大考" 西华大学应该 培养什么人.怎样培 ...

  5. 视频分辨率和音频质量_高分辨率音频的声音是否比CD质量好?

    视频分辨率和音频质量 在回应最近的一篇文章时,一位读者写道: 仍然需要压缩数据吗? 据我所知,在双盲测试中,没有人能比CD品质的未压缩音频更好地识别任何东西. MPEG添加了可以通过实践识别的功能. ...

  6. 读论文《对 感知音频质量 的 客观评估 综述---对其 应用领域依赖性 的评估》

    摘要 1.在过去几十年间,一些使用计算机去评测感知音频质量的方法被开发出来.这些客观评估方法通常是为特定应用领域设计和服务的. (背景:出现一些客观评估方法.) 2.由于这些方法很方便,他们常常被用于 ...

  7. 音频质量评价体系那些事

    前言 近年来,线上音视频的产品形态和应用场景越来越丰富,疫情更加速了许多行业线下转线上的布局,音视频技术也越来越受到各大厂的重视,Zoom的股价飞升,腾讯.字节.阿里等等巨头的大力投入,令这个赛道的竞 ...

  8. 缓解环境噪声对音频质量干扰

    随着数字技术的发展,我们的生活越来越离不开音频,对音频使用和呈现方式也越来越多样化,人们也从去单纯的听录制好的音频转向录制属于自己的音频,例如录歌.会议录音.录制短视频等.我们这些音频是高质量,清晰可 ...

  9. 体验心灵与阿根太湖电缆吹音频质量

    体验心灵与阿根太湖电缆吹音频质量 的阿根宁静被认为是基准,而评估的高端音频电缆.它是音乐发烧友的参考标准.阿根音频生产高端音响系统的高品质的音频电缆.这被认为是eference标准还有许多谁渴望的高保 ...

最新文章

  1. Coinbase内部调查未发现比特币现金内幕交易证据
  2. ItemAdding事件接收器中无法取到【创建者】的字段的值
  3. 乐视手机权限开启方法
  4. Java是如何加载资源文件的?(源码解毒)
  5. 17年9月计算机二级试题,9月计算机二级MSOffice练习试题
  6. python程序设计实验报告实验程序流程序列化_Python使用pickle模块实现序列化功能示例...
  7. 正则只能输入数字,一个小数点,第一位不能为小数点,保留两位小数,为正数,比较全的正则...
  8. 加载tensorflow模型后只运行变量名实现预测(sess.run)
  9. Web.Config介绍
  10. 图论解油瓶分油问题_一个很有趣的de novo图论算法
  11. Linux GRUB 引导Win 7 ---- error: invalid EFI file path
  12. 折腾kali linux2.0
  13. 服务器节点数及系统数量,计算节点服务器数量16.docx
  14. 实验四--项目技术指标(招标文件)
  15. 关于URDF中的惯性矩阵描述问题
  16. Android获取外网IP地址
  17. 凯文·凯利:AI将改变一切设计工作
  18. xaxis python_在python中绘制xaxis中的多列值
  19. fgetc php,php fgetc函数怎么用
  20. payjs 源码_WordPress插件:Payjs For Ponits基于Payjs开发的积分充值微信支付插件

热门文章

  1. LeetCode 145 ——二叉树的后序遍历
  2. Hyper-V和多处理器虚机
  3. 请求的安全信息不可用或无法显示
  4. 一站式VDI部署教程(3)配置存储分层和重复数据删除功能
  5. 2021年中国大学生程序设计竞赛 女生专场 - 热身赛 Problem C. 口算训练(质因子分解)
  6. HDU - 1536 S-Nim(sg函数)
  7. HihoCoder - 1831 - 80 Days(暴力)
  8. 数据挖掘竞赛-北京PM2.5浓度回归分析训练赛
  9. mybatis mysql 配置文件详解_Mybatis的配置文件参数详解
  10. Delphi常用关键字用法详解