语音识别-关键词检测
introduction
word-spotting,audio indexing,spoken term detection
输出的是word lattice,根据lattice计算关键词的后验概率。
ATWV=mean(\frac{N_{correct}(s)}{N_{true}(s)}-\beta\frac{N_{spurious}(s)}{T-N_{true}(s)})
其中 Ncorrect(s) N_{correct}(s)表示检测正确的个数, Ntrue(s) N_{true}(s)表示reference中关键词的个数, Nspurious(s) N_{spurious}(s)检测错误的个数,T表示音频的秒数。 β \beta在evaluation中一般设置为999.9。
检测系统共有四部分:
1. speech-to-text engine
输出lattice和single-best phonetic transcripts
2. indexer
The indexer takes these as input and creates an index containing a precomputed list of candidate detection records for each word in the speech-to-text lexicon. The index also contains the phonetic
transcripts to accommodate out-of-vocabulary search terms.
3. detector
The detector loads the index and processes a list of search terms, generating a sorted, scored list of detection records for each term.
4. decider
the decider takes the lists of candidate detections and the cost parameter β and sets a per-term score threshold for making yes/no decisions.
systerm
recognition
对于离线的大量语音数据,首先进行分段,然后使用通用语音识别系统对语音进行解码,获得lattice(边上包含有声学得分和语言得分)。
如果直接根据识别结果进行关键词检测,将会导致更多的漏报情况,因为同音词的存在。
indexing
建索引。假设lattice中出现的所有候选词分别是 w1,w2,...,wL w_1,w_2,...,w_L.
1. 首先计算每一个出现在lattice里面词 wi w_i的后验概率。根据lattice中包含有的似然得分信息。
2. 对同一时间段出现的相同词 wi w_i的后验概率累加作为最后的得分.
3. 使用 L L个独立的链表对所有lattice的词wiw_i进行汇总,按照后验概率从大到小的顺序。
detection
单个词:直接根据索引查询即可。
多个词:首先查询单个词,然后根据正确的词顺序和较短的时间间隔进行过滤。
decision
p>\frac{N_{true}}{T/\beta+\frac{\beta-1}{\beta}N_{true}}
其中 β−1β≈1 \frac{\beta-1}{\beta}\approx1,对于三小时的语音 T/β≈10 T/\beta\approx10, Ntrue(wi) N_{true}(w_i)未知,使用所有候选 wi w_i的后验概率和,乘以一个term无关的系数。
problems
out-of-vocabulary word
online systerm for real-time task
reference
rapid and accurate spoken term detection
kaldi keyword search code
语音识别-关键词检测相关推荐
- 傅里叶变换处理音频c++_KWS-SoC——基于Wujian100的音频流关键词检测SoC拓展开发笔记之一...
Keyword Spotting(KWS, 关键词检测),目的是在一串连续的音频流中检测出预定义的词或者词组.在实际应用中,比如手机的智能助手,智能住宅里所支持的语音指令等,都需要用到关键词检测,当用 ...
- 论文笔记 ---语音关键词检测方法综述
概述 相比于语音识别.语音合成.语音增强,说话人识别等常见语音领域,关键词检测相对来说比较小众,但随着智能助理.智能音箱等的兴起,关键词检测越来越受到产业界的 重视. 语音关键词检测关注如何从连续语音 ...
- 语音识别关键词,如何获取房产成交信息?
近年来随着互联网.GPU/CPU硬件的发展,语音识别的准确率有了很高的提升,并开始在商业上进行应用.不管是国内百度的小度助手,还是Google Assistant.亚马逊Alexa,早已不再满足于&q ...
- LaySNS插件—违规关键词检测插件
介绍: LaySNS这个程序我是挺喜欢的,简单小巧,稳定,虽说有些功能不是那么尽人意,但有句话是:功能不够,插件来凑. 这也让我更为体验到了代码的美妙. 前段时间我网站遭到赌博宣传人员恶意shua注册 ...
- 语音识别端点检测matlab,关于语音识别的端点检测问题
这是我的端点检测程序,语音是6个连续字,执行后却只检测了一个字的端点,求大神指点哪里的错 %读入语音 [x,fs,bits]=wavread('D:\voice\openleft.wav'); %增益 ...
- 几行代码让qq机器人关键词检测,让机器人也可以又哭又笑,戳一戳你
在之前的文章讲到了如何制作机器人,传送门:qq机器人制作 这里再发一个简单的demo插件 演示如下: 交流群:970353786,非诚勿扰. from nonebot import on_keywor ...
- php 敏感关键词检测,字符串 - PHP 敏感词违法关键字检测 算法方案
已有6000条关键字,分3批次. 一批为替换 replace,一批为遇到需要审核 censor,最后一批为遇到就禁止发布banned. 设计数据表如下: mysql> desc tbl_cens ...
- 阿里云文本关键词过滤检测
功能描述 关键词检测是对文本检测的最简单的一种方式,本文章对一段文本进行关键词的匹配,判断是否包含特定关键词. HTTP 接口描述 场景(scene)中文名 场景(scene) 分类(label) ...
- 智能家居中语音识别算法研究_语音识别研究获进展
中国科学院自动化研究所智能交互团队在环境鲁棒性.轻量级建模.自适应能力以及端到端处理等几个方面进行持续攻关,在语音识别方面获新进展,相关成果将在全球语音学术会议INTERSPEECH2019发表. 现 ...
最新文章
- 一些好用的 资料网站
- 修改.fig文件中图的x轴或y轴的标题及数据图
- 刚刚,OpenStack 第 19 个版本来了,附28项特性详细解读!
- Android Http客户端如何选择?
- 经常在命令提示符中所使用的命令
- 开源 免费 java CMS - FreeCMS1.5 标签 ajaxStore
- Linux Irq domain
- 关于java调用Dll文件的异常 Native library (win32-x86-64/CtrlNPCDLL.dll) not found in resource pat...
- Win10易升-在线升级工具
- Spydroid还是大牛直播内置RTSP服务SDK
- Alien Worlds NFT 自动点击游戏教程 (Allen worlds NFT auto click game tutorial)
- 问道手游服务器修改密码,问道手游去哪改密码 问道手游怎么更换修改密码手机号...
- 普通话读音 - 平舌音 / 前舌音 / 舌尖前音 - 翘舌音 / 卷舌音 / 舌尖后音
- 视频号引流有哪些方法?学会这几种方法快速吸粉
- 卡--配合--读卡器使用 磁卡 CPU卡 IC卡、ID卡、M1卡、射频卡区别 我在项目中使用到的S50卡(M1卡的一种)S50(Mifare 1K)卡简介及存储控制原理
- 【评测】MP DSS肠炎模型专用
- Unity发布WebGL注意事项以及移动端打开webgl网页
- 常用数据结构和算法操作效率的对比总结
- Java常用时间计算
- java毕业设计心理咨询与诊断系统(附源码、数据库)