2021“眼界大开 声临其境”网易首届音视频技术大会落下帷幕。来自网易旗下网易智企、网易游戏、网易云音乐、网易杭州研究院等众多音视频领域的技术大咖们齐聚一堂,结合自身多年研究与经验沉淀,与观众共同探讨音视频前沿技术创新,分享音视频应用实践成果,为行业发展带来了诸多新的思考和见解。

众所周知,视觉是万物感知的主要信息来源,听觉让沉默的信息更进一步而变得“有声有色”。在移动互联网时代下,“声色俱佳”的在线学习、工作、娱乐方式广受欢迎,互动直播、视频会议、远程招聘等新场景纷纷涌现。而其背后是音视频技术的鼎力支撑,潜移默化中融入了各行各业的在线场景。

基于此背景,“眼界大开 声临其境”网易首届音视频技术大会应运而生。紧密围绕着“色”与“声”,本次大会分别设置“眼界大开:视频技术创新视界”和“声临其境:音频技术沉浸体验”两大专题分会,全程为期两天,为所有到场嘉宾和线上观众奉献了一场酣畅淋漓的科技盛宴。

网易音视频技术大会

展技术,促交流

首先,本届大会的总出品人、网易智企技术 VP 陈功博士讲述了本届大会举办的契机和目的。陈功说道,近几年音视频技术发展迅猛,商业化落地加速,而网易在此领域持续进行着技术创新和突破,并在今年初成立了网易 TM599 音视频技术分委会,并期待通过分委会集中展示网易集团在音视频各个细分领域的技术能力积累,同时促进行业内的交流与合作。

网易智企技术 VP 陈功

眼界大开

视频技术创新视界

在“眼界大开:视频技术创新视界”专题分会上,专题出品人、网易音视频实验室高级技术专家韩庆瑞介绍了专题的主要内容,结合网易云音乐、网易易盾、网易云信、网易互娱在视频技术的实战经验,本场分会将围绕视频处理、视频深度鉴伪、内容安全、视频增强及计算机视觉技术、AI 舞蹈合成等话题展开深度分享。

网易音视频实验室高级技术专家 韩庆瑞

网易云音乐资深视频算法工程师眭世晨从当下火热的短视频领域切入,以技术视角深度剖析了云音乐中多种视频作品创作工具的功能和设计思路,并认为技术最终只是辅助创作者表达价值的工具,而非直接取代创作者的想法。

网易云音乐资深视频算法工程师 眭世晨

网易易盾资深图像算法工程师胡宜峰介绍了 AI 在各个场景应用的“双刃剑”效应,并以最为突出的人脸伪造隐患为例,从算法和应用的维度分享了网易易盾在视频深度伪造检测方面的解决策略和显著成果。

网易易盾资深图像算法工程师 胡宜峰

网易云信资深视频算法工程师周琛晖梳理了影响视频清晰度、色彩、质量等一系列问题的原因,并针对各项问题逐一分享了基于 AI 视频处理算法的解决方法,网易云信画质增强在实时音视频交互、低延时直播、点播等场景大有可为。

网易云信资深视频算法工程师 周琛晖

网易互娱资深 AI 研究工程师谭志鹏着重介绍了在游戏和影视行业中常见的舞蹈动画,并阐释了舞蹈动画生成背后不易的过程,以及如何通过 AI 音乐舞蹈合成算法技术,快速且高效的制作生成高质量的舞蹈动画。

网易互娱资深 AI 研究工程师 谭志鹏

声临其境

音频技术沉浸体验

“声临其境:音频技术沉浸体验”专题分会同样充满了技术干货。专题出品人、网易云音乐音视频实验室负责人刘华平介绍,新冠肺炎疫情极大推动了线上应用场景发展,实时音视频通话是众多应用中非常“刚需”的技术点,音质也是音视频通话系统中最为核心的参数之一。

网易云音乐音视频实验室负责人 刘华平

网易云信音频算法专家郝一亚首先回顾了 RTC 实时通信的背景和主要应用场景,并介绍了网易云信 AI 降噪技术的架构和效果,以及回声消除算法。在音频标准化评价体系建设方面,网易云信也付出了很多努力,如:设立音频实验室、建立降噪算法评价体系等,并期待以此不断推动国内 RTC 音频领域的发展。最后分享了网易云信诸如 3D 音效、AEC 等其他音频能力和音频实验室的学术研究成果。

网易云信音频算法专家 郝一亚

网易云音乐音视频算法负责人赵翔宇表示,沉浸式音频对用户获得真实的、身临其境的体验非常重要。围绕此主题,赵翔宇列举了影响声场沉浸感的主要因素,以及应对的技术方案。最后展示了技术方案的音频效果,让所有现场和线上的观众也一起“沉浸”了一把。

网易云音乐音视频算法负责人 赵翔宇

来自网易杭州研究院的语音算法专家刘东、杨震、李响聚焦于 AI 技术在语音相关领域的研发与应用多年,并分别从各自深耕的音频理解系统、语音识别中的声学模型、语音识别线上推理系统三大维度展开讲述了研发过程中面对的技术挑战、解决思路和实际案例。

网易杭州研究院语音算法专家  刘东、杨震、李响

网易游戏雷火音频设计专家付明铭则以 AI 音乐的开发和应用为主题进行了分享。付明铭提出,AI 音乐是一个算法和艺术的交叉领域,本质是通过各种算法对音乐数据进行分析与学习,形成审美相对确定的风格模型,并基于用户输入在选定的风格模型中进行内容生成。

网易游戏雷火音频设计专家 付明铭

大会已落幕

技术分享从不止步

2021 “眼界大开 声临其境”网易首届音视频技术大会已圆满落幕。大会上,来自音视频各个细分领域专家们的精彩演讲,为行业实践与应用提供了切实可行的技术方案,也为行业发展提供了新的思考和见解,指引着未来技术方向和发展趋势。

大会已经落幕,技术共享从不止步。讲师们的真知灼见吸引了超过5.4万人次观看,并广受观众认可。为方便观众重温回顾,促进技术交流共享,演讲视频将陆续发布于实践者沙龙、云商会、MCtalk、Bilibili 等平台,相关内容文章也将陆续发布于“网易智企技术+”微信公众号,敬请各位关注。

扫一扫关注公众号,立马获取最新资讯~

                

“眼界大开 声临其境”网易首届音视频技术大会圆满落幕相关推荐

  1. 报名丨“眼界大开 声临其境”网易首届音视频技术大会倒计时!

    视觉是万物感知的主要信息来源,听觉让沉默的信息更进一步,变得"有声有色". 移动互联网时代下,"声色俱佳"的在线学习.工作.娱乐方式广受欢迎,互动直播.视频会议 ...

  2. 眼界大开 声临其境丨胡宜峰:视频深度伪造检测技术在内容安全领域的探索与实践

    导读:「眼界大开 声临其境」技术系列课第三期.网易易盾资深计算机视觉算法工程师胡宜峰带来了主题为<视频深度伪造检测技术在内容安全领域的探索与实践>技术分享. 讲师简介:胡宜峰,网易易盾资深 ...

  3. 网易云信音视频技术落地提速,读书郎电话手表成行业先锋

    合作快讯 2018年第一季度,中国可穿戴设备市场出货量达到1200万台,同比增长 15.9%.处于市场发展初期的可穿戴设备能够保持这样的稳步增长,IDC明确指出,这主要源于4G儿童手表市场的迅猛增长. ...

  4. 网易创新企业大会倒计时,云信将发布新一代音视频技术架构

    网易创新企业大会倒计时 4 天! 当下,科技创新已成为推动经济社会发展的主要力量,运用创新技术构建前瞻性业务模式.提高业务增长成为各大企业生存和发展的重要着力点. 对此,网易旗下一站式企业服务提供商网 ...

  5. 网易云信音视频能力中台,聚焦银行业数字化转型

    在银行业数字化转型加速的大背景下,如何利用数字化手段和远程服务模式合规地完成非接触服务成为最棘手的问题,原有的手机银行等线上渠道欠缺更智能的协同和交互手段,无法满足和支撑日新月异的金融互动场景. 针对 ...

  6. 报名 | 网易MCtalk: 5G+AI新时代 探索音视频技术创新与实践

    4G时代,音视频技术高速发展,直播行业异军突起,在社交.娱乐.电商.教育.医疗等领域高歌猛进.5G和AI时代已至,音视频技术定会上升到一个全新的高度,新场景.新应用.新标准也必将出现.特殊的2020年 ...

  7. 音视频技术“塔尖”之争,网易云信如何C位出道?

    社交+美颜.抖音短视频.在线狼人杀.直播竞答.子弹短信--,过往两三年间,互联网新产品和新玩法层出不穷,风口不断切换.这些爆红的网络应用背后,都有一些共同的特征,例如音视频与社交功能的融合. 近期,网 ...

  8. 网易云信流媒体首席架构师:新一代音视频技术架构如何构建?

    前沿:5G 与 AI 时代已来,音视频技术持续迭代升级,网易云信推出了全新一代音视频技术架构.新一代音视频架构有哪些核心技术?各技术在线上场景又有哪些落地实践方案? 文|吴桐 网易云信流媒体首席架构师 ...

  9. 发布新一代音视频技术架构,网易云信夯实头部玩家地位

    今年,在疫情影响下,不少企业开始真正习惯于通过音视频等非接触式工具为长效市场增加动力,这让音视频赛道变得更加热闹.在激烈的角逐中想要脱颖而出,音视频企业需要同时攻克构建底层技术.打通场景化应用,实现客 ...

  10. 网易视频云一站式托管音视频技术 助推游戏直播新方向

    回顾过去的一年,视频直播俨然成为互联网界最抢眼领域之一.一夜之间,秀场直播类的网易BOBO.六间房,全民直播类的花椒.映客,游戏直播类的斗鱼.虎牙,纷纷破土而出,200多家创业公司正在野蛮生长.视频直 ...

最新文章

  1. Linux下sar命令的使用
  2. cocospod 安装和使用
  3. Meson,用于协调和调度Netflix推荐工作流的架构
  4. uni-app 修改富文本信息中的图片样式
  5. 面向侧面的程序设计AOP-------《二》本质
  6. linux tips 技巧笔记一
  7. 如何系统的自学python-如何系统地自学 Python?
  8. Excel导入SQL数据库出现的问题
  9. 查看GCC编译优化的具体选项开关
  10. 【PAT】1105 Spiral Matrix(柳婼的思想详细解读)
  11. plex插件显示无服务器,Plex插件
  12. AspNetPager 存储过程
  13. pdf图片怎么转换成word文档?
  14. java控制发送邮箱(qq邮箱、网易邮箱、新浪邮箱)
  15. Dell PowerEdge RAID控制器存在一个潜在问题
  16. 现有的DRM数字版权保护技术大全
  17. 台式机与笔记本辐射谁大
  18. 403 Forbidden nginx/1.6.2
  19. springboot 配置文件加密
  20. stroj测试网络搭建

热门文章

  1. 我们是怎么简单打开百度的?
  2. 详细的苹果快捷键,赶快保存吧!
  3. 微信与微博的粗略比较(产品设计)
  4. (十五)使用任务通知实现命令行解释器
  5. 餐厅叫号语音包_医院叫号系统(需自行下载语音包)
  6. 微带贴片天线的分析方法-传输线模型法
  7. 怎样用Python的Numpy库求反正切
  8. 使用python开发多人一对一聊天系统(文字聊天,视频通讯,文件传输)
  9. 三台Centos7虚拟机之间实现ssh,rsh互连,虚拟机和本机基于ssh进行文件传输
  10. 【C++】初窥门径---入门篇