KWS_关键词命名+识别率和误识别率
关键词命名:
1. 命令词中相邻汉字的声母区分度越大越好,比如“消息”、“小心”,这样的不容易识别,因为相邻汉字的声母都是x,最好是不同的声母。
2. 命令词中的字最好不要有语气词,如“啊”、“呢”等。
3. 命令词尽量是四个字,可以有少量的三个字的。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
识别率和误识别率:
计算识别率,用关键词音频组成的正向识别集。
识别率=(注入某关键词音频只识别出某关键词的次数)➗ 注入音频总次数*100%
如果你们只做纯命令词测试,只统计识别率就可以。
如果一定要统计 A误报成B的情况,这个建议不要称为 误识别,可以称为 误分类,或者其他更达意的说法。
误识别率,通常理解的是正向识别集里,把注入A音频识别成了B,其实不对;
误识别率一般说的是半小时或者一小时误识别次数,一小时的任意录音(比如录一段相声,小品,新闻联播,或者开会的人声),看发生了多少次误报,然后给出 误报次数每小时的数据
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
误报率改善:
每一次的识别都会有得分,正报时分值小,误报时分值高。所以误报率可以通过降低阈值,把分值大的过滤掉,应用层代码可以对关键词逐个设置阈值;
但是降低阈值,正向识别率就会下降,就是反应不那么灵敏,声音小或者声音不清晰都可能识别不出来,本质上是得分的区分度不明显。
可以看下正报最高和误报最低分,理想的情况是阈值正好在两个值之间,既不影响识别又可以抑制误报。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
如有错误请指正修改~
KWS_关键词命名+识别率和误识别率相关推荐
- 误报率、故障检测率、漏报率、虚警率、误警率等指标异同及计算公式
文章目录 误报率.故障检测率.漏报率.虚警率.误警率等指标异同及计算公式 1. 一些标准指标的计算 true positive rate (tp rate)[真阳性率], or hit rate [命 ...
- 精选用户故事|洞态在聚水潭的误报率几乎为0,如何做到?
亮点锦集: 我个人在实际使用过程中体验到,对于像命令执行和sql注入这类漏洞,洞态能够做到百分百的检测. --Spenser 除了之前关于敏感信息检测这一块有误报,其它基本没有.不过这块儿经过优化之后 ...
- 目标检测(降低误检测率及小目标检测系列笔记)
深度学习中,为了提高模型的精度和泛化能力,往往着眼于两个方面:(1)使用更多的数据(2)使用更深更复杂的网络. ** 一.什么是负样本 ** 负样本是指不包含任务所要识别的目标的图像,也叫负图像(Ne ...
- 布隆过滤器之误识别率FPP公式的推导
在<什么是布隆过滤器(Bloom Filter)?>一文中,多次提到了误识别率(FPP,false positive probabilistic). 那么误识别率到底是多大,应该如何计算呢 ...
- 国税局发票查验中英文验证码识别最新版,识别率99.9%
采用深度学习进行发票查验验证码模型的训练,在我电脑上模型训练的环境如下: 显卡:RTX 2080TI tensorflow-gpu:2.5.3 1 训练集和测试集的准备 发票查验的验证码分为4种类型, ...
- 基于Python的开源人脸识别库:离线识别率高达99.38%
基于Python的开源人脸识别库:离线识别率高达99.38% 2019年04月18日 18:13:18 AI终结者 阅读数 1233 项目地址:https://github.com/ageitgey/ ...
- Python的开源人脸识别库:离线识别率高达99.38%【源码】
以往的人脸识别主要是包括人脸图像采集.人脸识别预处理.身份确认.身份查找等技术和系统.现在人脸识别已经慢慢延伸到了ADAS中的驾驶员检测.行人跟踪.甚至到了动态物体的跟踪.由此可以看出,人脸识别系统已 ...
- python开源人脸识别库识别率达99_Python的开源人脸识别库:离线识别率高达99.38%...
本文的模型使用了C++工具箱dlib基于深度学习的最新人脸识别方法,基于户外脸部数据测试库Labeled Faces in the Wild 的基准水平来说,达到了99.38%的准确率. 数据测试库L ...
- 信息抽取(五)实体命名识别之嵌套实体识别哪家强,我做了一个简单的对比实验
实体命名识别之嵌套实体识别哪家强 嵌套实体识别 实体矩阵构建框架 方法比较 GlobalPointer TPLinker Tencent Muti-head Deep Biaffine 实验结果 总结 ...
最新文章
- 【PAT (Basic Level) 】1014 福尔摩斯的约会 (20 分)
- 曾是谷歌程序员,抛下百万年薪创业,4 年成就 7 亿用户,今身价百亿!
- .net OCX 无法获取“****”控件的窗口句柄,不支持无窗口的ActiveX控 新解决方法...
- Larbin 安装遇到的问题(fedora)
- 项目中涉及到的BAPI
- 移动硬盘上划分linux分区,Linux下磁盘分区和移动硬盘的挂载方法有哪些?
- 安装Openface,实现人脸比对
- Linux应用:FTP
- html5调用手机摄像头和相册,h5 调用手机摄像头/相册
- 移动应用开发——实验二
- 60-400-240-使用-binlog-Canal使用文档md
- java内存分配与回收策略、动态对象年龄判断、空间分配担保
- oa服务器日常维护,OA系统怎么维护?
- 软考网络工程师+计算机等级考试四级网络工程师--MAN标准LAN标准
- 【matlab图像处理】图像处理工具箱(2)
- 计算机显示磁盘但是打不开怎么办,移动硬盘显示盘符但打不开解决教程
- APP开发者应办理许可或备案手续
- 【精品】身份证操作工具类
- 解决ConstraintLayout两个组件挤压问题
- linux systemctl命令详解
热门文章
- 如何在香港主机上尽可能多的建站
- “包”治百病,BOS丰富的预付费资源包来了
- 免校准的电量计量芯片_免校准电能计量芯片,让家电智能化更简单
- ssh框架的学习之strut2小测试(2)
- 服务器系统2016开始菜单,大法将致:将Windows Server 2016打造成个人办公系统,WIN2016打造成超级WIN10,WIN2016优化设...
- 计算机科学报数学竞赛,五大学科竞赛参加哪一个科目?五大学科竞赛赛程设置分析!...
- 抠图应用程序设计(二)——磁性套索工具Livewire算法的实现
- Python A*算法的简单实现
- 团队作业——Alpha冲刺 1/12
- 2021年中国研究生数学建模竞赛A题(华为公司命题)——相关矩阵组的低复杂度计算和存储建模