网易云信资深音频算法工程师李备日前接受LiveVideoStack采访,对于音频技术的未来,他给出了自己的观点。

LiveVideoStack:李备你好,能否向读者介绍下自己,以及目前主要的工作和关注的技术方向?

李备:我叫李备,中科大硕士毕业,先后入职Cisco WebEx,网易云信。在软件实时音频领域工作5年多,从事过语音前处理算法,音频引擎框架搭建,音频编码器优化,移动端的移植解决方案,音频测试框架搭建等工作。目前在网易主要负责网易云信的音频算法的优化,音频框架的设计,以及不同场景下的解决方案的制定等工作。主要关注业界的音频解决方案框架,音频算法与音频的机器学习方法等方向。

LiveVideoStack:能否介绍下网易云信在教育和实时通讯领域有哪些特色技术和产品,未来有哪些发展规划?

李备:网易云信一直都关注在线教育行业,已经推出的在线教育解决方案覆盖大型直播教学、大班互动教学、小班辅导教学全系列的在线课堂模式,帮助开发者能够快速地搭建和上线在线教育产品。网易云信深知在不同的在线教育垂直行业有着不同的教学特点,接下来网易云信将秉承场景化解决方案的思路,为在线教育行业推出特点鲜明更加契合场景需求的解决方案。举例来讲,今年早些时候网易云信推出的在线音乐教学解决方案,针对在线音乐教学对于声音的音质与高还原要求,首创定制研发了高清音乐模式,创新性得将音频处理的专业领域与具体的行业场景紧密结合,这也是接下来网易云信会坚持的道路与价值。

LiveVideoStack:展望整个多媒体通讯领域,你认为哪些(开源)技术栈将会快速发展?

李备:随着AI算法的成熟,终端硬件的计算能力的提升,一些AI算法在多媒体通讯领域的应用以前只能在实验室实现的方法有了落地的可能,甚至在实时音视频领域。比如视频的超分技术,音频的基于深度学习的降噪等技术可能在算法优化与硬件升级的某个临界值下实现大规模的落地。

LiveVideoStack:一种观点认为,现在做多媒体开发比十年前容易很多,因为有许多强大的开源框架、工具(如WebRTC、FFmpeg、x.264)以及像网易云信这样的多媒体PaaS平台,你怎么看这种观点?

李备:现在不管是多媒体的应用开发还是做多媒体的底层平台开发和十年前相比确实容易很多了。主要体现两个方面,第一,多媒体的大环境越来越成熟,包括终端设备的性能,网络的带宽,系统的相关API的支持,国内相关人才数量等十年内都有了天翻地覆的变化。十年前基本只有巨头公司才能玩得起多媒体,现在多媒体开发已经是大部分的基本功能了。第二,有越来越多的开源架构,算法等开源(如WebRTC、FFmpeg等),同时又有越来越多的专业的多媒体服务平台(如 网易云信等),会提供端到端的多媒体的解决方案,场景的覆盖也非常广,从大型会议模式,到点对点,直播,转播,从低功耗设备方案到大屏方案等,使得开发多媒体的开发成本及周期都大大缩短。

LiveVideoStack:实时音视频已成为许多应用的刚需性配置,但在这一领域,因为较高的技术开发和资源投入门槛,也为云技术服务企业带来了严峻挑战。具体讲一下NRTC工业级的音视频技术框架和开源的框架有什么区别?

李备首先,技术全面。NRTC全面的技术开发支持包括:各种媒体服务器、信令服务器、认证与管理服务器、混音转码录制等服务、各种SDK等。此外,NRTC既支持UDP也支持TCP,既支持实时也支持准实时通话,这是对WebRTC作为客户端框架只支持UDP的实时通话的一种完善和补充。

其次,功能全面。

1) NRTC可以提供实时音视频通话功能,这一方案是基于UDP的,时延低于400ms;

2) NRTC可以提供直播功能,这一方案是基于TCP的,可以提供高质量的准实时的直播能力,时延1~3s;

3) NRTC也可以将实时音视频通话和直播能力相结合,提供互动直播功能,通过上麦下麦控制用户在连麦和观众模式间切换;

4) NRTC可以提供点播功能,通过NCDN实现海量分发;

5) NRTC可以提供短视频功能,短视频SDK也一并俱全。

第三,场景全面。NRTC具备高效落地多元化场景应用的能力。NRTC可以提供实时音视频通话功能、直播功能。此外,NRTC还支撑了网易内外部各个客户的海量应用,譬如网易云音乐、网易新闻、有道、云课堂等。

第四:灵活。NRTC传输层采用私有协议的方式,确保RTC实时通信功能可灵活实现,改善了WebRTC因标准化为个性化开发带来的困难。基于传输层私有协议,用户可以很容易的扩展媒体包,这大大提升了开发的便捷性,改变了过去在WebRTC开发环境下,JavaScript 无法修改和访问RTP数据包和RTCP控制包的局限性。

第五,NRTC对于WebRTC的优化。NRTC是同时适应于Web和Server开发的完整的音视频技术解决方案,改善了WebRTC只能针对Web进行点对点实时通信功能开发的状况。NRTC在现有的VoIP系统里通过WebRTC Gateway来兼容WebRTC,最终目的是让音视频技术走出实验室,实现We b音视频的工程化开发及应用。同时,NRTC根据自己的业务需要实现了很多libwebrtc里没有的功能,并做了优化。

第六,易用。用户只要接入SDK即可完成多元化功能实现:

1) Web端的音视频通话,无需自行再写服务器、信令。

2) 实现Web端和其它移动端、PC端的互通,改善WebRTC只针对Web端的局限性。

3) 实现双人点对点和多人会议,改善WebRTC只支持点对点的状况。

4) 实现Web端的互动直播。

5) 实现IM+Web音视频+聊天室+互动直播+拉流播放器。

LiveVideoStack:搞多媒体开发需要学习大量的基础知识,而且需要在实际工作中摸爬滚打。对于学习多媒体开发,您有哪些建议?能否推荐一些多媒体开发相关的学习资料或书籍。

李备:多媒体开发的门槛相对于其他开发确实高一些,如果是做多媒体的应用的开发,需要熟悉多媒体的一些基本概念,以及多种开源算法,或者框架的主要作用和影响,比如采样率,通道数,编码码率等基本概念,音频不同编码器(如AAC 、MP3、OPUS等)的适用范围,AEC、NS都是什么算法有什么作用等等。如果是开发多媒体底层算法或者框架的同学就需要有更加扎实的基础,推荐可以看下《离散时间语音信号处理》和《语音增强的理论与实践》的电子版本,除此之外可以看看开源框架的设计,RFC的一些行业标准。

LiveVideoStack:音视频领域还有哪些学界、工业界公认的难点?未来今年,哪些难点有可能取得突破?

李备:说说音频的吧,回声消除一直就是工业界里面的难点,难在终端设备的采集播放设备的多样性,应用场景的复杂性,终端性能有限等方面,软件层很难有完美的落地方案。未来,可能像计算量非常大的非线性自适应滤波器也可以落地移动端。而对于音乐内容,学术界都没有很好的回声消除方案,未来也许会出现一些与AI技术的结合可以在音乐内容的回声消除方案。

LiveVideoStack:说说你将在LiveVideoStackCon 2018分享的内容吧。

李备:这次在LiveVideoStackCon分享的主题是“音乐场景下的实时音频解决方案”,主要会讲下普通场景的音频解决方案的框架,每个模块的主要作用,可能会遇到的挑战和问题,再来分析下,音乐场景的新的挑战,以及普通解决方案在音乐场景下的不足,以及网易云信在音乐教学下的一些思考。

10月11日 19:30,网易云信资深音频算法工程师李备将进行LiveVideoStackCon讲师热身分享。本次李备将与大家分享教育场景下的实时音视频解决方案,讨论在线教育的音频需求,一般软件音频框架,以及行业的挑战。

报名方式:扫码添加MCtalk小助手,小助手将于10月10日统一发送报名链接

此外,10月19日大会第一天 ,在教育专场中,网易云信资深音频算法工程师李备老师将与您分享《音乐场景下的实时音频解决方案》相关话题,欢迎特别关注!

点击【阅读原文】进入官网了解详情。

【LiveVideoStack采访】李备:音视频技术的难点与未来相关推荐

  1. LiveVideoStack音视频技术2018年度评奖揭晓

    经过一个月的投票与评审,LiveVideoStack评出了音视频技术2018年度获奖者. 一个月前,LiveVideoStack启动音视频技术2018年度评奖,总共获得393份有效问卷.考虑到一些故意 ...

  2. 别光看世界杯 7月还有一场音视频技术盛宴等着你

    在全世界球迷的瞩目下,2018世界杯在上周激情上演,相信接下来的一个月时间里无数球迷又将守在电视前为自己喜欢的球队摇旗呐喊. 当然,在移动互联网发达的今天,即使不在电视前,你也可以随时随地掏出手机,打 ...

  3. 【城市沙龙】LiveVideoStack Meet|合肥:在“霸都”邂逅音视频技术

    重启LiveVideoStack Meet后,我们遇到了许多新鲜的面孔,听到了不少有趣又专业的分享.秉持着初心,我们希望给更多二线城市带来零距离的技术交流机会.12月11日,LiveVideoStac ...

  4. LiveVideoStack线上交流分享 ( 五 ) —— 在线教育音视频技术探索与应用

    为了给大家提供一个学习,交流的平台,畅聊音视频技术开发新趋势,新实践.我们推出了LiveVideoStack线上交流分享活动,在每周四晚19:30,邀请1名业内资深技术专家进行线上分享技术干货,解答热 ...

  5. LiveVideoStack音视频技术年度评奖启动

    没有颁奖,没有严谨的评奖流程,他是商品经济下的产物,但他至少能体现我们愿意鼓励哪些人或团队. 文 / 包研 多年的编辑生涯让我对"评奖"这件事产生了偏见--这不过是媒体平台和赞助商 ...

  6. 音视频技术开发周刊 | 190

    每周一期,纵览音视频技术领域的干货. 新闻投稿:contribute@livevideostack.com. 漫画 | 20多年了,为什么国产CPU还是不行? 故事得从IBM发明PC兼容机开始.当年, ...

  7. 音视频技术开发周刊 | 150

    每周一期,纵览音视频技术领域的干货和新闻投稿:contribute@livevideostack.com. LiveVideoStackCon 2020线上峰会 内容整理 守得云开见日出--危机之下的 ...

  8. 音视频技术开发周刊 | 133

    每周一期,纵览音视频技术领域的干货和新闻投稿:contribute@livevideostack.com. 架构 蘑菇街云端直播探索--启航篇 随着移动网络速度提升与资费的降低,越来越多的用户逐渐接受 ...

  9. 音视频技术开发周刊 | 132(FFmpeg决策委员会委员 刘歧)

    每周一期,纵览音视频技术领域的干货和新闻投稿:contribute@livevideostack.com. 本周,我们邀请了FFmpeg 社区活跃开发者.FFmpeg决策委员会委员刘歧对本期音视频技术 ...

最新文章

  1. 低代码缺少的五大组件
  2. golang 数组 最后一个_面试必问:Golang高阶Golang协程实现原理
  3. 152. 乘积最大子数组
  4. oxford5k和paris6k数据集介绍_sklearn函数:KFold(分割训练集和测试集)
  5. ubuntu mysql怎么备份_Ubuntu下MySQL备份与异地备份
  6. 计算机网络(十六)-轮询访问介质访问控制
  7. 代码实现:输入某年某月某日,判断这一天是这一年的第几天?
  8. matlab2014b linux,matlab 2014b linux 肿么安装
  9. 基于PyQt5实时曲线绘制源代码和串口调试助手源代码带文件保存加载十六进制显示Python两个工程的源代码
  10. HHUOJ 1860 哆啦A梦的口袋
  11. Android复制文件
  12. 如何在WORD中插入图片自动编号,并引用图号【每天一个小技巧】
  13. 《周一清晨的领导课》笔记-NO.1
  14. 修改电脑ip为固定ip不能上网
  15. java web 表单提交_Java Web 表单(form)提交问题!
  16. 中华万年历头条数据聚合优化之路
  17. 支付宝小程序JS省市区三级联动
  18. 一天一个机器学习小知识——Lasso、Ridge以及ElasticNet
  19. 尚好房 04_服务拆分
  20. Python:信号量semaphore

热门文章

  1. 团队作业10——复审与事后分析(Beta版本)
  2. CocoaPods 的使用与一些异常情况的处理
  3. 使用DFS求任意两点的所有路径
  4. (转)php-cli模式学习(PHP命令行模式)
  5. 两块 硬盘 主从盘跳线详解
  6. kindle 3快捷键
  7. 六式建站浅见,和大家一起分享,不足之处还望斧正。
  8. 计算字符在字符串是出现的次数
  9. Spring Boot程序无法加载主类解决方法
  10. HTML+CSS+JavaScript复习笔记持更(五)——CSS选择器