近日,全球顶级音频技术会议 ICASSP 2022 公布了论文入选名单。网易云信音频实验室论文——《一种针对实时通信的基于神经网络的啸叫检测方法》(A Neural Network-based Howling Detection Method for Real-time Communication Applications)被大会接收,并受邀于今年5月在会议上向学术和工业界做研究报告。

这是网易云信音频实验室创新成果连续两年受到世界顶级学术会议认可。

ICASSP(International Conference on Acoustics, Speech and Signal Processing)即国际声学、语音与信号处理会议,是 IEEE 信号处理协会主办的全球最大、最全面的音频领域顶级会议,具有权威、广泛的学界及工业界影响力,在国际上享有盛誉。

随着 AI 的迅速发展,深度神经网络在声音场景分类(ASC, Acoustic Scene Classification)和声音事件检测(AED, Acoustic Event Detection)任务中的应用已越来越多,并且明显优于传统的信号处理方法。网易云信音频实验室本次研究则是将 AI 技术应用于啸叫检测中,该论文为 AI 啸叫检测领域在全球范围内首个公开发表的研究成果。

当扬声器和话筒之间的声学耦合产生正反馈时,啸叫便会产生。传统的公共广播系统和助听器设备利用传统的啸叫功能检测和抑制啸叫。然而,实时通信(RTC)中的传统啸叫功能会受到非线性和不确定性的影响,如各种扬声器/麦克风响应、多种非线性音频处理、不稳定的网络传输抖动、声学路径变化和环境影响等。在啸叫检测中,使用特定时间-频率特征的信号处理方法对 RTC 场景是无效的。

网易云信音频实验室提出了一种基于卷积递归神经网络(CRNN)的方法,用于 RTC 应用中的啸叫检测,实现了出色的准确性和低误报率。该篇文章使用不同的移动设备收集和标记啸叫数据集用于模型训练,并选择对数梅尔谱作为输入特征,实现了 89.46% 的检测率和 0.40% 的误报率。此外,所提出方法的模型大小仅为 121kB,并且已在实时运行的移动设备中实现。

作为行业内首批音视频 AI 实验室之一,网易云信音频实验室不断探索“AI+音频”前沿技术方向,连续取得业界权威认可。2021年,实验室在 AI 音频降噪和 AI 音乐检测的研究成果被第 50 届国际噪声控制工程会议(INTER-NOISE 2021)收录,自建的国内行业中首个 AI 音乐检测模型受到了高度关注。本次AI啸叫检测成果被 ICASSP 2022接收,再次证明了网易云信在音频技术领域的顶尖研究实力。

未来,网易云信音频实验室将持续引领新技术发展方向,并将先进的算法模型应用于产品和场景中,为全球用户打造极致听觉体验。

 往期回顾 

1.网易云信2篇论文入选INTER-NOISE 2021

2.网易云信被纳入Gartner《CPaaS市场指南》

3.网易云信再被列入Gartner最新CPaaS市场报告

网易云信AI音频最新研究成果获世界顶级学术会议 ICASSP 2022 认可相关推荐

  1. 像人类一样理解言外之意,阿里AI最新研究成果被国际顶会收录

    AI的语言理解能力又进一步了!7月30日,在全球线上举行的人工智能顶会SIGIR 2020上,阿里巴巴研究团队表现突出,共有29项研究成果入选,是全球论文数量最多的科技公司.据悉,阿里在多个成果中展现 ...

  2. 腾讯Turing Lab论文入选ICASSP,图像AI研究成果获国际认可

    近日,全球顶级信号处理技术会议 ICASSP 2022 公布了论文入选名单.由王君乐博士带领的腾讯Turing Lab实验室论文--<针对手机游戏的主观与客观视频质量评价>(Subject ...

  3. 阿里云视频云视频增强领域最新研究成果入选国际顶级学术会议

    ICASSP 2022(International Conference on Acoustics, Speech and Signal Processing)是全球最全面的信号处理及其应用方面的顶级 ...

  4. 网易云信实时音频框架背后:算法优化带来产品体验全面提升

    2018年10月19日,LiveVideoStackCon音视频技术大会在北京召开.本届会议以"技术开启新'视'界"为主题,汇集资深的音视频技术工程师,探讨在音频.视频.图像等技术 ...

  5. 港科夜闻|香港科大唐本忠院士团队整合最新研究成果:刺激响应型聚集诱导发光材料...

    关注并星标 每周阅读港科夜闻 建立新视野 开启新思维 1.香港科大唐本忠院士团队整合最新研究成果:刺激响应型聚集诱导发光材料.香港科大唐本忠院士和浙江大学团队,从不同刺激响应类型,如力.光.极性.温度 ...

  6. 我国AI医疗及人工智能医疗公司现状+2019年全球引领医疗健康的AI初创公司+科大讯飞和依图科技AI医疗发展情况+AI在医疗领域总结+面临的问题+AI医疗最新研究进展

    1.我国AI医疗及人工智能医疗公司现状 本节链接 2.2019年全球引领医疗健康的AI初创公司 本节链接 3.科大讯飞和依图科技AI医疗发展情况 本节链接 4.AI在医疗领域发展总结 本节链接 5.面 ...

  7. HIV艾滋最新研究成果进展(2021年11月)

    自 1981 年首例艾滋病病例报告以来,人类和艾滋病的抗争已持续 40 年.时至今日,艾滋病仍是一项重要的全球公共卫生问题.联合国艾滋病规划署相关报告显示,2020年全球约有150 万新发 HIV 感 ...

  8. NeurIPS 2019年十篇机器学习领域的论文解读:来自谷歌、Facebook、普林斯顿大学、斯坦福大学最新研究成果

    本文整理总结了NeurIPS 2019上十篇机器学习领域的论文,这些论文来自谷歌.Facebook.普林斯顿大学.斯坦福大学等团队的最新研究成果,供大家参考学习. Differentiable Ran ...

  9. 数据 3 分钟 | 腾讯云最新研究论文被国际顶级会议收录、员工因删库被法院判刑7年、elastic 宣布将更改开源协议...

    数据 3 分钟 由 ACDU (中国 DBA 联盟) 与墨天轮联合出品的全新视频节目上线啦-三分钟带你来了解数据行业动态,节目内容主要包含数据行业最新的产品发布.公司大事件.行业新闻等.每周五更新,不 ...

最新文章

  1. C - Heavy Transportation POJ - 1797
  2. 赠书 | 人工智能变“人工智障”?关于因果关系的新科学
  3. 重置linux内核,Linux Kernel 驱动非授权重置统计漏洞
  4. [Python图像处理] 十八.图像锐化与边缘检测之Scharr算子、Canny算子和LOG算子
  5. 每天一道LeetCode-----在字符串s中找到最短的包含字符串t中所有字符的子串,子串中字符顺序无要求且可以有其他字符
  6. w7电脑蓝屏怎么解决_怎么解决0x0000007b电脑蓝屏 解决0x0000007b电脑蓝屏方法【详细步骤】...
  7. java本地方法不能是final_Java final关键字
  8. “对不起,我们只招有出色背景的技术人员!”
  9. 小姐姐把信息撤了后如何查看?Python百行代码分秒恢复!
  10. mysql 安装是否成功,启动,查看配置文件,连接
  11. MATLAB中四阶单位矩阵,matlab-线性代数 创建 N阶数量矩阵 N阶单位矩阵 对角矩阵 范德蒙矩阵 等差数列......
  12. QT 插入视频并实现循环播放
  13. mybatis-generator工具生成对应的自定Service和Controller
  14. 非三星手机无法登录三星账号_如何解决所有三星手机的烦恼
  15. 《人性的弱点》25句经典语录
  16. css 超出显示省略号
  17. MySQL||SQL_ERROR_INFO: “You can‘t specify target table ‘titles_test‘ for update in FROM clause“
  18. 二分类神经网络结果准确率50%,loss一直在0.69的解决方法
  19. 思科交换机等设备基本配置
  20. Gradle配置阿里云仓库

热门文章

  1. 关于cookie 跨页面处理
  2. [LeetCode]Single Number II
  3. 理解SQLNET.AUTHENTICATION_SERVICES参数|转|
  4. 关于MSSQL存储过程中使用游标的一个小例子(学习)
  5. 机器人学习--Mobile robot国内外优秀实验室
  6. Java实现excel的读与写(Apache POI)
  7. 增强型的for循环linkedlist_Java: 增强for循环针对list的时候,是严格按照list的顺序依次遍历的吗?...
  8. 声学漫谈之五:音腔是怎么影响声音效果的
  9. c语言是结构化 模块化,c语言是完全模块化和结构化的语言,怎么理解,什么是模块化和结构化...
  10. X 039 0203 039 mysql_2020年寒假假期总结0203