通过产学研合作项目和腾讯犀牛鸟精英人才培养计划,西北工业大学计算机学院智能语音方向谢磊教授团队与腾讯合作的基于QBE的语音关键词检出技术近日成功上线腾讯信息服务。这也是继去年该团队语音识别后处理技术成功落地腾讯之后,西北工业大学与腾讯又一在人工智能校企合作上的硕果。

b4c27a99-3e21-eb11-8da9-e4434bdf6706.jpeg

西北工业大学语音关键词检出技术上线腾讯信息服务

语音关键词检出是智能语音处理领域的一项关键技术,是指从语音流中检测出设定目标内容的一类技术。智能手机和智能音箱中语音助手的语音唤醒功能就是语音关键词检出技术的代表。同时,语音关键词检出在网络语音信息搜索和大数据信息挖掘中有着举足轻重的作用。

此次西北工业大学与腾讯合作研发的技术围绕实际应用场景中说话人多样性、重口音、场景复杂、噪声干扰类型繁多等挑战问题,利用基于大规模深度学习的QBE模板匹配技术进行鲁棒性建模,和传统深度关键词检出(deep kws) 算法和基于网格(lattice)检索算法相比,该技术不依赖传统的复杂声学模型建模,而从海量关键词样例出发,学习更为有效的特征表征。通过对多风格、口音、不同声学环境下相同关键词语音信号本身进行大规模深度学习建模,可以有效提升关键词检测性能,检出率大幅提升10%以上,精准率提升3.5%。该技术在黄赌毒信息检测上发挥了重要的作用,并已成功应用在腾讯安全天御的内容风控服务中,经过多方评测,关键词检出效果远超竞品。

据统计,该技术日调用量超过亿次,例如在《王者荣耀》S16赛季后上线的文明语音对战系统,可以对困扰用户的谩骂语音进行自动检测,创造和谐文明的游戏环境。同时在网络直播这种复杂异构的声学场景中,基于QBE的关键词检出技术同样对违规现象的发现发挥了重要作用。

b7c27a99-3e21-eb11-8da9-e4434bdf6706.jpeg

腾讯游戏中基于关键词检出技术的不良语音检测

该技术的成功应用离不开校企合作的大力支持。腾讯犀牛鸟精英人才培养计划是腾讯围绕高校拔尖研究生的校企人才培养计划,每年仅支持少数顶尖学者。通过该计划可以让学生接触产业真实问题、拓展科研思路、验证学术理论、联合发表论文、实现学术突破。

2018年10月,刚刚从新加坡国立大学联合培养归来的博士生袁有根同学,凭着出色的研究背景和丰硕的前期成果,从众多申请人中脱颖而出,成功入选该计划。在腾讯联合培养期间,结合西工大智能语音方向的雄厚技术积累和腾讯的真实场景,在双方导师的联合指导下,面对复杂声学建模的难题,发挥出出色的创造力,提出了基于深度学习的QBE关键词二次验证方案,有效的提升了复杂场景下的语音关键检出性能。同时该研究成果总结的论文“VERIFYING DEEP KEYWORD SPOTTING DETECTION WITH ACOUSTIC WORD EMBEDDINGS”发表在语音研究旗舰会议语音识别与理解国际会议(ASRU2019)上,在新加坡进行了论文宣读,受到了同行的广泛关注。袁有根同学另外一篇瞄准提升性能并同时提升搜索效率的论文“Fast Query-by-example Speech Search using Attention based Deep Binary Embeddings”也于近期发表在语音研究顶级刊物IEEE/ACM Transactions on Audio, Speech and Language Processing上。

bac27a99-3e21-eb11-8da9-e4434bdf6706.jpeg

博士生袁有根在腾讯合作研究

bcc27a99-3e21-eb11-8da9-e4434bdf6706.jpeg

博士生袁有根同学在新加坡ASRU2019国际会议上与讲解关键词检出研究成果

智能语音方向在语音关键词检出方面具备雄厚的研究基础。2014和2015年曾先后获得低资源语音关键词检出国际评测(QUESST)第二名和第一名的突出成绩;2015年和2017年与新加坡资讯通讯研究院、新加坡国立大学合作获得零资源语音(Zerospeech)关键词检出国际评测第一名和第二名的优异成绩,该评测围绕更为挑战的“无标注场景”,进一步证明了西北工业大学在该方向上的突出实力。同时,博士生侯靖勇的论文“基于DTW的语音关键词检出”获得2015年全国人机语音通讯学会会议最佳学生论文奖,相关研究成果也成功应用于微软“小英”在线英语学习应用中,帮助语言学习者提升学习效果。

c0c27a99-3e21-eb11-8da9-e4434bdf6706.jpeg

关键词检出论文获得2015年全国人机语音通讯学会会议最佳学生论文奖

c5c27a99-3e21-eb11-8da9-e4434bdf6706.jpeg

获得零资源挑战赛第一名暨最佳论文奖

ccc27a99-3e21-eb11-8da9-e4434bdf6706.jpeg

西北工业大学智能语音交互技术团队

智能语音团队所在的音频语音与语言处理研究组(ASLP@NPU)隶属于空天地海一体化大数据应用技术国家工程实验室。实验室拥有中国工程院院士3名,优秀人才20多人。近年来该实验室在张艳宁教授的带领下,围绕人工智能中的语音与图像处理与多模态感知方面各种关键性问题取得了突出进展,相关成果获国家级、省部级科技奖10多项,研究成果应用于智能家居、人机语音交互、空间感知、灾害监测、无人机、医学图像等多个方面,产生了良好的经济和社会效益。

近年来围绕国家“新一代人工智能”拟人化人机交互的重大需求,实验室深入开展包全链路智能语音处理技术。在多项语音识别、关键词检出、语音增强、声纹识别国际评测中取得第一名的顶尖成绩,入选2019《互联网周刊》中国人工智能高校排行十大顶尖实验室。产学研合作是该实验室的一大特色。目前实验室先后与包括腾讯、华为、阿里巴巴、搜狗、微软、字节跳动、爱奇艺、百度、小米、京东等在内的业界众多企业开展广泛深入、多层次的产学研合作,研究成果应用于语音搜索、智能音箱、智能玩具、手机语音助手、录音笔、智能手表、智能电视、在线语言学习、远程语音会议、AI开放平台和云端信息服务中。此次关键词检出技术上线腾讯是该实验室在人工智能校企合作中的又一硕果。

稿件来源:西北工业大学

西北工业大学计算机操作系统实验_西北工业大学语音关键词检出技术上线腾讯信息服务...相关推荐

  1. 西北工业大学计算机操作系统实验_西北工业大学,2020年计算机考研考情分析...

    这段时间会给大家各大院校20考研数据,2020西北工业大学计算机考研的初试数据如下: 航海学院 注: 825 通信原理: 1. 张会生,张捷,李立欣. 通信原理. 北京:高等教育出版社,2011. 2 ...

  2. 华北电力大学计算机图形学实验报告,华北电力大学计算机图形学实验报告分析.doc...

    华北电力大学计算机图形学实验报告分析 科 技 学 院 课程设计(综合实验)报告 ( 2013 -- 2014 年度第 2 学期) 实验名称 OpenGL基本图元绘制实验 课程名称 计算机图形学 | | ...

  3. 中南民族大学 计算机组成原理实验报告,中南民族大学计算机组成原理课程设计报告.pdf...

    计算机科学学院 课程设计报告 课程 计算机组成原理 题 目 基 于 TEC-2000 平 台 的 (a ⊕ b+c)and(d+1) 指令设计 年级 2012 级 专业 计算机科学与技术 学号 201 ...

  4. 中南民族大学计算机图像处理实验报告,中南民族大学数字图像处理 实验报告.pdf...

    WORD格式 院系:计算机科学学院 专业:计算机科学与技术 年级: 2011 级 课程名称:数字图像处理 组号: 02 姓名 ( 学号 ) :谢枫 石小飞 黄煜 柳卫平 李春豪 指导教师:徐胜舟 20 ...

  5. 中南民族大学计算机图像处理实验报告,中南民族大学数字图像处理实验报告.docx...

    院 系:计算机科学学院 专 业: 计算机科学与技术 年 级: 2011 级 课程 名称: 数字图像处理 组 号: 02 姓名(学号): 谢枫石小飞黄煜柳卫平李春豪指导教师:徐胜舟 2014年4月29日 ...

  6. 中南民族大学计算机图像处理实验报告,中南民族大学数字图像处理程序及图像...

    数字图像处理实验课 matlab实验程序 以及图像结果 附带有命名图 仅供参考 定有错误 木有绝对正确 实验1 1-1 close all; clear; f=zeros(40,40);% f(10: ...

  7. 中国矿业大学计算机学院实验,中国矿业大学计算机学院实验报告

    中国矿业大学计算机学院实验报告 (4页) 本资源提供全文预览,点击全文预览即可全文预览,如果喜欢文档就下载吧,查找使用更方便哦! 19.9 积分 中国矿业大学计算机学院实验报告 课程名称 操作系统教程 ...

  8. 大学计算机基础实践教程第二版素材,920730-大学计算机基础-实验素材-大学计算机基础教程2...

    <920730-大学计算机基础-实验素材-大学计算机基础教程2>由会员分享,可在线阅读,更多相关<920730-大学计算机基础-实验素材-大学计算机基础教程2(7页珍藏版)>请 ...

  9. 计算机系统结构结构相关实验报告,计算机系统结构实验报告(中南民族大学).doc...

    计算机系统结构实验报告(中南民族大学).doc 院 系 专 业 年 级 课程名称 计算机系统结构 学 号 姓 名 指导教师 年 月 日年级班级学号专业计算机科学与技术姓名题目名称矩阵相乘题目内容1. ...

最新文章

  1. NAR:rrnDB-16S拷贝数校正数据库
  2. mysql od函数_Mysql数学函数不求人
  3. 什么是工业级交换机?工业交换机作用有哪些?
  4. Android深度探索(卷1)HAL与驱动开发 读书笔记(第四章)
  5. 【Makefile由浅入深完全学习记录8】条件判断语句
  6. C++ STL vector的容量
  7. 屏占比更高!16英寸Macbook Pro再曝光
  8. winform list集合怎么 in过滤_你有真正把 Python Set 当作数学集合吗?
  9. java反编译工具jad安装
  10. 从Garmin USB中读取GPS数据(串口实现)
  11. 【渝粤题库】国家开放大学2021春2409中国古代文学(B)(1)题目
  12. 进度模型方法论,利用“削峰填谷”进行资源优化
  13. 转行做程序员,月薪过万需要多久?
  14. Latex、如何将word中的表格转换为Latex代码
  15. sonar (default-cli) on project webgoat-parent: Not inside a Git work tree 错误以及解决方案
  16. 在计算机领域中 ascii码,在计算机领域中,ascii码用一个字节来干什么
  17. python 实现多继承
  18. 简单的stm32程序
  19. 区块链中的Merkle树
  20. uni组件uni-search-bar默认值

热门文章

  1. HRBUST 2044 方方正的棋盘
  2. 逻辑回归(LR)的原理及其推导
  3. 公司取好名字的方法妙招
  4. MySQL去重插入方法
  5. MySQL卸载、安装与使用
  6. 正确解决:坑爹的0xc000007b
  7. 【短视频运营】账号主页搭建 ① ( 昵称 | 昵称原则 | 昵称公式 | 昵称禁忌 | 个人简介 | 个人简介公式 )
  8. 计算机二级用户名找回,计算机二级证书丢了怎么办如何找回
  9. Ubuntu16.04下的英文词典Artha
  10. 合并类游戏模板Demo