9月15日,由即构科技ZEGO主办的2018音视频技术嘉年华在来到上海。这次,我们邀请到了即构科技、TutorABC、咪咕视讯、触宝科技、Intel的5位音视频技术专家,就音视频圈热议的WebRTC、Qos、AI、4K,以及新一代视频技术,和现场70多名技术爱好者共同交流讨论。

考虑到有些朋友没有到现场,小极狗特摘取了部分精彩内容,和大家分享。

《AI技术在实时语音通信的探索》

分享嘉宾:吴威麒,触宝科技staff data scientist 

现场,吴威麒老师跟大家介绍了VOIP语音技术,以及语音处理与机器学习之间的关系,重点从三个技术方向介绍了AI技术如何跟传统的语音技术结合。

一是回声消除, VOIP技术是比较传统的技术,首当其冲的就是回声消除。我们可以把回声消除的非线性处理和AI技术结合,尝试解决多极值点、收敛速度和回声路径的问题,由于数据量问题,并不能直接套用DNN(深层神经网络)方法,所以采用局部模块结合机器学习,能产生一定的作用,但不能完全解决。

二是语音降噪,吴威麒提出了深度学习降噪的新思路,除了常用的mapping方法,像GF-TPS、MASK和RDAE(去噪编码器)都是值得学习的。而基于深度学习的降噪方法,在非平稳情况下效果突出,但仍需改进增强方法的稳定性。

三是端点检测,传统的信号分析法需要遍历全部数据,而结合AI技术的VAD更加适合分类学习的方法,或者将语音信号看作图像使用CNN(卷积神经网络)进行学习,在性能上比传统方法有显著提高。

最后,吴威麒老师表示,在语音通信领域中,传统的信号处理方法依然存在且有效,而结合AI技术的语音处理也有其优势,在实时语音的降噪和VAD处理上有更好的效果。

《Zego WebRTC网关服务器实践与Qos策略》

分享嘉宾:黄开宁,即构科技音视频资深架构师

黄开宁老师和大家分享了音视频圈的热点技术——WebRTC技术,结合即构WebRTC网关服务器的实践,介绍了WebRTC架构的设计和网关实现以及Qos策略。主要包含了四方面内容。

第一部分,黄开宁老师给大家介绍了WebRTC的发展历程,并从教育、医疗、直播等不同应用场景介绍了WebRTC的接入使用。

第二部分是WebRTC网关架构的设计,作为平台商,他表示需要根据用户实际需求选择合适的网关架构,因为网关的作用是将现有系统和WebRTC进行打通。黄开宁老师还和大家分享了不同的拓扑方案,并详细地介绍了Mesh、SFU、MCU方案的优缺点和即构WebRTC网关架构。在即构的架构中,由于考虑转码和混流对于服务器的要求比较高,所以即构的架构是分布式的,通过架构性调整输出以保证质量。

第三部分是WebRTC网关的实现方式,一般可以选择现有的开源项目、自主研发或者第三方SDK。作为技术主导型的公司,即构的方案是自主研发的,他表示在自研WebRTC网关过程中遇到了不少的困难,首先是WebRTC的连通性,由于WebRTC 的连通性能是有问题的,所以需要自行打通,另外是RTT计算,在传输过程中RTT是重要的指标,即构的方案中是通过ICE协议的标准特点更准确地获取RTT数据,最后是关键帧的请求,由于WebRTC协议特点,需要增加对关键帧的获取。

第四部分是有关Qos策略,其中包括丢包重传和码率控制,具体策略有ARQ、FEC、GCC等。

最后,黄开宁老师总结到,目前在WebRTC标准下,实现程度不一,我们仍需解决的不同平台的兼容性问题,以及不断优化Qos策略。

 《支持复杂交付的实时互动云课堂》

 

分享嘉宾:董海冰,TutorABC研发总监

与前两位老师演讲的角度不一样,董海冰老师给我们分享的是如何通过自主研发获得实时音视频互动的能力。

首先,他给大家介绍了WebRTC的相关知识,包括WebRTC的架构、浏览器支持的情况、WebRTC协议栈和连通性等,在连通性的介绍中着重分享了SDP协议、SFU、MCU的优缺点,另外还介绍了几个WebRTC的开源项目。

接着,他分享了TutorMeet+的概况,这个项目是使用Go语言进行开发,目前已经是2.0版本,底层的路由器也是自主研发的。在自主研发的过程中面临了不少的挑战:

一是前端布局、设备获取等交互设计随着业务模块的增多变得复杂,加上前端技术也是蓬勃发展,导致版本快速更新迭代;

二是不同网络情况下的控制算法需要灵活选择,因为网络情况是很复杂的,相应的控制算法也不少,重点是如何选择合适的控制算法进行匹配;

三是数据和服务上怎样排查故障,他表示Tutor是采取半自动化系统进行检测,绝大部分故障能够通过AI方式判断然后做相应的处理,其他故障则由人工分析解决;

四是灰度和分区策略,他表示为了避免出现故障,在区域内先进行测试,没问题才进行区域扩张。

最后,董海冰老师表示,未来,在在线教育领域,像互动编程交互、电子笔支持、AI技术、AR/VR技术和IoT产品等都是值得期待的。

《Intel CS for WebRTC媒体服务器架构设计与实践》 

分享嘉宾:戴建辉,英特尔多媒体架构师 

戴建辉老师从产品的角度给大家介绍的是基于WebRTC的通讯架构套件——英特尔CS,但是在原有的基础上,加入了其他转码服务、AI服务和流媒体服务,所以说这已经不仅是局限于WebRTC的产品。

英特尔CS主要包含三大模块的内容:客户端、服务端和云上的分布式部署。客户端通过SDK接入,支持多终端平台;服务端主要基于底层硬件加速服务对视频处理、编解码、图像增强等进行加速;云上的英特尔CS分布式架构支持多种WebRTC部署方式。

服务端中对音视频主要有四种处理方式:转发、转码、混流和视频分析。在视频分析中,主要根据在客户端接到的视频流分发到不同设备而选择不同的方式,其中有直接转发、经过转码后再转发,或者是经过混流后转发。

在传统的视频会议中,英特尔CS的混流支持多种定制化模式,可以根据设备能力选择合适的视频帧率,接入媒体服务端后还可以进行视频分析。他表示,目前英特尔CS支持软硬件加速。转码相对比较简单,都是基于英特尔的Media SDK 进行硬件加速。

在新加入的视频分析功能中,通过识别的人像推导边界信息,加上试点通知,可以推测出当前画面的人数,这个是通过openVINO对于神经网络进行加速得到。目前,英特尔CS的加速主要通过DNN对CPU进行加速和通过实现架构对CPU进行加速。

最后,戴建辉老师表示,目前英特尔CS的媒体处理部分是开源的,WebRTC产品也是逐渐实现开源,欢迎大家下载试用。

 《4K实践及下一代视频技术探讨》 

 

分享嘉宾:王琦,咪咕视讯技术总监

王琦老师给我们带来的是《4K实践及下一代视频技术探讨》的主题演讲,首先他给我们介绍了今年世界杯直播中,中国移动咪咕熟悉使用了4K技术进行直播,将传统直播中的25帧提升到50帧,加上多视角多机位,给大家带来了全新的直播新体验。

他表示,目前4K技术依然是通信领域关注的热点所在,随着4K技术的逐渐普及,中国也有了第一个4K频道,而未来视频产业在4K技术方面,对于分辨率、交互性、多终端的提高也是有所要求,他也期待在VR、医疗诊断、教育培训等多种应用场景中能更好地融入4K技术。

接下来,王琦老师给我们从分辨率、动态范围、色度、帧率和色深5个方面简单地介绍了HDR的相关知识,另外还介绍了目前移动网络的现状。随着5G网络的提出,其突出的下载速度、连接密度和时延数据,吸引了不少关注,目前各大运营商也在积极地准备,预计2020年能够投入使用。在5G网络新场景下,随着组网架构和业务要求的变化,在基础资源、架构、带宽、时延、同步等需求会有所不同,相关标准也需要进行重构。

他表示,在超高清技术和网络状况良好发展的大环境下,对于视频转码也提出了新的要求。目前使用的HEVC和H.265在标准专利收费上尚不明确,而随着5G网络的发展,大家可以关注我们国家自己定制的AVS标准。从数据上看,AVS标准的编码效率和质量等都是优于HAVC的,而AVS2也逐渐被国际组织所接受,大家也可以持续关注。

活动留影

关注“即构科技ZEGO”公众号,回复“zego”即可获取嘉宾演讲PPT。

继深圳、北京、上海举办音视频技术嘉年华,后续我们还将在杭州、广州等地举办。

想参加的朋友,可随时关注公众号发出的活动消息哦。

ZEGO 2018上海音视频技术嘉年华 活动回顾PPT下载相关推荐

  1. ZEGO 2018上海音视频技术嘉年华 活动回顾

    9月15日,由即构科技ZEGO主办的2018音视频技术嘉年华在来到上海.这次,我们邀请到了即构科技.TutorABC.咪咕视讯.触宝科技.Intel的5位音视频技术专家,就音视频圈热议的WebRTC. ...

  2. 参会者说丨LiveVideoStackCon 2019上海 音视频技术大会

    技术盛会?行业前沿?思想碰撞?看看参会者怎么说! 4月19日到20日的LiveVideoStackCon 2019上海音视频技术大会在上海圆满落下帷幕.作为深耕音视频技术的社区媒体,LiveVideo ...

  3. 音视频技术的高光时刻: LiveVideoStackCon 2019上海 音视频技术大会

    Mux 流媒体专家Phil Cluff在4月19.20日举办的LiveVideoStackCon 2019上海音视频技术大会中发表了主题演讲,并根据自己在大会中的所见所闻,对其它部分精彩内容进行了详细 ...

  4. 展望2018音视频技术:AV1,AI,区块链,WebRTC

    编者按:音视频技术的历史可能要追溯到19世纪末--特斯拉与爱迪生的伟大时代.直到今天,他们的发明依然伴随我们生活的每时每刻.2018年音视频技术将有哪些突破?来自学霸君的资深架构师袁荣喜从编解码器.客 ...

  5. 嘉宾PPT分享|泛娱乐领域音视频技术探索与实践

    2021·MCtalk 5G 技术大带宽.低延时.海量连接的特点,让短视频.直播购物.游戏.音视频社交等变得更加简单,同时,互联网的发展带来了泛娱乐领域的多样化体验,让大众对于 AI 以及音视频的体验 ...

  6. 音视频技术开发周刊 93期

    『音视频技术开发周刊』由LiveVideoStack团队出品,专注在音视频技术领域,纵览相关技术领域的干货和新闻投稿,每周一期.点击『阅读原文』,浏览第93期内容,祝您阅读愉快. 架构 Nodejs+ ...

  7. 李大龙:音视频技术是互联网品质生活的连接器

    结识李大龙源于LiveVideoStackCon 2017,忙碌的工作让我们在会场擦肩而过,并相约一场采访.通过采访,我深深的感受到他对行业的执着与热情,他将音视频技术定义为互联网品质生活的连接器,而 ...

  8. LiveVideoStackCon上海2019音视频技术大会 7折早鸟票最后3天

    与LiveVideoStackCon共享音视频技术盛宴. 文 / 包研 2019年4月19-20日,LiveVideoStackCon上海2019音视频技术大会将在上海光大会展中心国际大酒店举行.从V ...

  9. LiveVideoStackCon音视频技术大会首次来到上海

    音视频技术生态盛宴--LiveVideoStackCon将在2019年来到上海,并从即日起开启招募讲师与出品人. 文 / 包研 2019年4月12-13日,将迎来LiveVideoStackCon上海 ...

最新文章

  1. 好渴望 wacom Intuos3
  2. 使用BCH提供的Cryptonize创建自己的加密代币
  3. 用计算机弹100万个可能,计算机应用基础试题与答案-2(选择题100道)(16页)-原创力文档...
  4. 网络工程:3.1 RIP(Routing Information Protocol)协议
  5. IP头、TCP头、UDP头详解以及定义
  6. java 使用本机代理_Java与本机代理–他们所做的强大功能
  7. 转载-聊一聊深度学习的activation function
  8. GaussDB(DWS)发生数据倾斜不要慌,一文教你轻松获取表倾斜率
  9. IOS 内存优化和调试技巧
  10. 安装列表阿里云UBUNTU 12下安装LAMP
  11. 投影查询(2020-3-13)
  12. 电脑主板故障维修案例
  13. opencv android模版匹配,基于opencv模板匹配的目标检测方法
  14. 新手教程直连路由的配置
  15. linux和Windows 左(正)斜杠右(反)斜杠用法对比
  16. 计算机英语这门课上后感1000,英语公开课观后感作文1000字
  17. 深度揭秘:微软内部爱恨纠葛
  18. c语言编写计算机软件,基于C语言的计算机软件编程分析.doc
  19. 自动回复邮件 html,创意十足的邮件自动回复
  20. 项目经理面试中可能遇到的问题(持续更新)

热门文章

  1. 【nowcoder 219035】春游
  2. 经典网页设计:30个创意的 CSS 应用案例
  3. 【人工智能项目】Fashion Mnist识别实验
  4. 戴尔服务器T30不读硬盘,【戴尔 POWEREDGE T30服务器开箱展示】硬盘|散热|机箱|内存_摘要频道_什么值得买...
  5. GLES2.0中文API-glCompressedTexImage2D
  6. 实验1:用户的登录与退出、IO重定向与简单文件操作
  7. 新一代视频编码标准:VVC、AVS3
  8. Cloud Programming Simplified: A Berkeley View on Serverless Computing
  9. lumia 525 android 7.1,给大神跪了!诺基亚Lumia 520成功刷上安卓7.1
  10. java对象上有横线_对象bean间属性值复制:无视大小写和下划线_和横杠-