introduction

word-spotting,audio indexing,spoken term detection
输出的是word lattice,根据lattice计算关键词的后验概率。

ATWV=mean(Ncorrect(s)Ntrue(s)−βNspurious(s)T−Ntrue(s))

ATWV=mean(\frac{N_{correct}(s)}{N_{true}(s)}-\beta\frac{N_{spurious}(s)}{T-N_{true}(s)})
其中 Ncorrect(s) N_{correct}(s)表示检测正确的个数, Ntrue(s) N_{true}(s)表示reference中关键词的个数, Nspurious(s) N_{spurious}(s)检测错误的个数,T表示音频的秒数。 β \beta在evaluation中一般设置为999.9。
检测系统共有四部分:
1. speech-to-text engine
输出lattice和single-best phonetic transcripts
2. indexer
The indexer takes these as input and creates an index containing a precomputed list of candidate detection records for each word in the speech-to-text lexicon. The index also contains the phonetic
transcripts to accommodate out-of-vocabulary search terms.
3. detector
The detector loads the index and processes a list of search terms, generating a sorted, scored list of detection records for each term.
4. decider
the decider takes the lists of candidate detections and the cost parameter β and sets a per-term score threshold for making yes/no decisions.


systerm

recognition

对于离线的大量语音数据,首先进行分段,然后使用通用语音识别系统对语音进行解码,获得lattice(边上包含有声学得分和语言得分)。
如果直接根据识别结果进行关键词检测,将会导致更多的漏报情况,因为同音词的存在。

indexing

建索引。假设lattice中出现的所有候选词分别是 w1,w2,...,wL w_1,w_2,...,w_L.
1. 首先计算每一个出现在lattice里面词 wi w_i的后验概率。根据lattice中包含有的似然得分信息。
2. 对同一时间段出现的相同词 wi w_i的后验概率累加作为最后的得分.
3. 使用 L L个独立的链表对所有lattice的词wiw_i进行汇总,按照后验概率从大到小的顺序。

detection

单个词:直接根据索引查询即可。
多个词:首先查询单个词,然后根据正确的词顺序和较短的时间间隔进行过滤。

decision

p>NtrueT/β+β−1βNtrue

p>\frac{N_{true}}{T/\beta+\frac{\beta-1}{\beta}N_{true}}
其中 β−1β≈1 \frac{\beta-1}{\beta}\approx1,对于三小时的语音 T/β≈10 T/\beta\approx10, Ntrue(wi) N_{true}(w_i)未知,使用所有候选 wi w_i的后验概率和,乘以一个term无关的系数。


problems

out-of-vocabulary word
online systerm for real-time task


reference

rapid and accurate spoken term detection
kaldi keyword search code

语音识别-关键词检测相关推荐

  1. 傅里叶变换处理音频c++_KWS-SoC——基于Wujian100的音频流关键词检测SoC拓展开发笔记之一...

    Keyword Spotting(KWS, 关键词检测),目的是在一串连续的音频流中检测出预定义的词或者词组.在实际应用中,比如手机的智能助手,智能住宅里所支持的语音指令等,都需要用到关键词检测,当用 ...

  2. 论文笔记 ​​​​​​​---语音关键词检测方法综述

    概述 相比于语音识别.语音合成.语音增强,说话人识别等常见语音领域,关键词检测相对来说比较小众,但随着智能助理.智能音箱等的兴起,关键词检测越来越受到产业界的 重视. 语音关键词检测关注如何从连续语音 ...

  3. 语音识别关键词,如何获取房产成交信息?

    近年来随着互联网.GPU/CPU硬件的发展,语音识别的准确率有了很高的提升,并开始在商业上进行应用.不管是国内百度的小度助手,还是Google Assistant.亚马逊Alexa,早已不再满足于&q ...

  4. LaySNS插件—违规关键词检测插件

    介绍: LaySNS这个程序我是挺喜欢的,简单小巧,稳定,虽说有些功能不是那么尽人意,但有句话是:功能不够,插件来凑. 这也让我更为体验到了代码的美妙. 前段时间我网站遭到赌博宣传人员恶意shua注册 ...

  5. 语音识别端点检测matlab,关于语音识别的端点检测问题

    这是我的端点检测程序,语音是6个连续字,执行后却只检测了一个字的端点,求大神指点哪里的错 %读入语音 [x,fs,bits]=wavread('D:\voice\openleft.wav'); %增益 ...

  6. 几行代码让qq机器人关键词检测,让机器人也可以又哭又笑,戳一戳你

    在之前的文章讲到了如何制作机器人,传送门:qq机器人制作 这里再发一个简单的demo插件 演示如下: 交流群:970353786,非诚勿扰. from nonebot import on_keywor ...

  7. php 敏感关键词检测,字符串 - PHP 敏感词违法关键字检测 算法方案

    已有6000条关键字,分3批次. 一批为替换 replace,一批为遇到需要审核 censor,最后一批为遇到就禁止发布banned. 设计数据表如下: mysql> desc tbl_cens ...

  8. 阿里云文本关键词过滤检测

    功能描述 关键词检测是对文本检测的最简单的一种方式,本文章对一段文本进行关键词的匹配,判断是否包含特定关键词.​ HTTP 接口描述 场景(scene)中文名 场景(scene) 分类(label) ...

  9. 智能家居中语音识别算法研究_语音识别研究获进展

    中国科学院自动化研究所智能交互团队在环境鲁棒性.轻量级建模.自适应能力以及端到端处理等几个方面进行持续攻关,在语音识别方面获新进展,相关成果将在全球语音学术会议INTERSPEECH2019发表. 现 ...

最新文章

  1. 一些好用的 资料网站
  2. 修改.fig文件中图的x轴或y轴的标题及数据图
  3. 刚刚,OpenStack 第 19 个版本来了,附28项特性详细解读!
  4. Android Http客户端如何选择?
  5. 经常在命令提示符中所使用的命令
  6. 开源 免费 java CMS - FreeCMS1.5 标签 ajaxStore
  7. Linux Irq domain
  8. 关于java调用Dll文件的异常 Native library (win32-x86-64/CtrlNPCDLL.dll) not found in resource pat...
  9. Win10易升-在线升级工具
  10. Spydroid还是大牛直播内置RTSP服务SDK
  11. Alien Worlds NFT 自动点击游戏教程 (Allen worlds NFT auto click game tutorial)
  12. 问道手游服务器修改密码,问道手游去哪改密码 问道手游怎么更换修改密码手机号...
  13. 普通话读音 - 平舌音 / 前舌音 / 舌尖前音 - 翘舌音 / 卷舌音 / 舌尖后音
  14. 视频号引流有哪些方法?学会这几种方法快速吸粉
  15. 卡--配合--读卡器使用 磁卡 CPU卡 IC卡、ID卡、M1卡、射频卡区别 我在项目中使用到的S50卡(M1卡的一种)S50(Mifare 1K)卡简介及存储控制原理
  16. 【评测】MP DSS肠炎模型专用
  17. Unity发布WebGL注意事项以及移动端打开webgl网页
  18. 常用数据结构和算法操作效率的对比总结
  19. Java常用时间计算
  20. java毕业设计心理咨询与诊断系统(附源码、数据库)

热门文章

  1. 研究生入门,如何高效阅读论文
  2. WPS文件转Excel文件怎么转?建议看看这些方法
  3. GTASA圣安地列斯如何打MOD2(简单教程)
  4. 带符号整数的除法与余数
  5. 程序员薪水变化数据大曝光,哭着上班,笑着拿工资!
  6. WIN中SCHTASKS用法(定时执行程序)
  7. 如何设计空白页面,体验更好!
  8. Thread.currentThread()、isAlive()、Thread.sleep()的使用
  9. 入门设计原则C++实现五:依赖倒置原则
  10. 你真的知道什么是元音什么是辅音吗?