语音识别(ASR)评估指标-WER(字错误率)和SER(句错误率)

前言

实际工作中,一般识别率的直接指标是“WER(词错误率,Word Error Rate)”

定义

WER 字错误率句错误率

为了使识别出来的词序列和标准的词序列之间保持一致,需要进行替换、删除或者插入某些词,这些插入、替换或删除的词的总个数,除以标准的词序列中词的总个数的百分比,即为WER。

公式为: 

Substitution——替换

Deletion——删除

Insertion——插入

N——单词数目

SER

SER,SER表述为句子中如果有一个词识别错误,那么这个句子被认为识别错误,句子识别错误的的个数,除以总的句子个数即为SER

其计算公式如下所示: 

注意事项

  1. WER可以分男女、快慢、口音、数字/英文/中文等情况,分别来看。

  2. 因为有插入词,所以理论上WER有可能大于100%,但实际中、特别是大样本量的时候,是不可能的,否则就太差了,不可能被商用。

  3. 站在纯产品体验角度,很多人会以为识别率应该等于“句子识别正确的个数/总的句子个数”,即“识别(正确)率等于96%”这种,实际工作中,这个应该指向“SER(句错误率,Sentence Error Rate)”,即“句子识别错误的个数/总的句子个数”。不过据说在实际工作中,一般句错误率是字错误率的2~3倍,所以可能就不怎么看了

语音识别(1)---语音识别(ASR)评估指标-WER(字错误率)和SER(句错误率)相关推荐

  1. 语音识别(ASR)评估指标-WER(字错误率)和SER(句错误率)

    前言 实际工作中,一般识别率的直接指标是"WER(词错误率,Word Error Rate)" 定义 WER 字错误率句错误率 为了使识别出来的词序列和标准的词序列之间保持一致,需 ...

  2. 语音识别数据集及性能评测指标WER

    语音识别 LibriSpeech ASR corpus LibriSpeech 数据集 共将近1000个小时的数据集.分为clean和other两类.具体见链接. WER评价指标 WER means ...

  3. mlfviewer_语音识别ASR - HTK(HResults)计算字错率WER、句错率SER

    HResults计算字错率(WER).句错率(SER) 前言 好久没发文,看到仍有这么多关注的小伙伴,觉得不发篇文对不住.确实好久没有输出经验总结相关的文档,抽了个时间,整理了下笔记,发一篇关于ASR ...

  4. 语音识别ASR - HTK(HResults)计算字错率WER、句错率SER

    HResults计算字错率(WER).句错率(SER) 前言 好久没发文,看到仍有这么多关注的小伙伴,觉得不发篇文对不住.确实好久没有输出经验总结相关的文档,抽了个时间,整理了下笔记,发一篇关于ASR ...

  5. c++ 文字识别_AI算法测试——语音识别(ASR)模型评估指标探索

    如上图,我们通过微信发送了一段语音,在对语音进行转文字时.语音识别引擎首先会将把这段语音进行分帧(切分成若干小段),然后利用声学模型将提取的每一帧的声学特征识别为一个个"状态",多 ...

  6. linux语音识别_linux语音识别 arm_linux 语音识别引擎 - 云+社区 - 腾讯云

    广告关闭 腾讯云双11爆品提前享,精选热门产品助力上云,云服务器首年88元起,买的越多返的越多,最高满返5000元! 简介语音识别是针对已经录制完成的录音文件,进行识别的服务,异步返回识别文本,可应用 ...

  7. 语音识别研究综述——阅读笔记3(端到端语音识别、语音识别的难度与热点)

    端到端语音识别 传统语音识别由多个模块组成,彼此独立训练,但各个子模块的训练目标不一致,容易产生误差积累,使得子模块的最优解并不一定是全局最优解. 针对这一问题,提出了端到端语音识别,直接对等式(1) ...

  8. auuc 评估指标_分类之性能评估指标

    本文主要介绍几种常用的用于分类的性能评估指标,同时介绍如何绘制ROC曲线以及计算AUC值的便捷方法.最后再附上一个绘制ROC曲线和计算AUC的Python源码实现. Precision和Recall ...

  9. 机器学习模型评估指标总结!

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货 作者:太子长琴,Datawhale优秀学习者 本文对机器学习模型评估指标 ...

最新文章

  1. jquery获取服务器控件的值
  2. Android安全加密:非对称加密
  3. 使用互斥体使程序只运行一个
  4. windows环境里React-Native运行失败的原因之一,安卓模拟器未启动
  5. mui.ajax php,求助!!!关于mui ajax获取不到后台数据
  6. Spring处理log4j
  7. 如何删除mysql软链接,Linux中移除(删除)符号链接的命令
  8. linux中安装mysql_Linux下安装MySQL
  9. 多媒体互动项目-Unity与继电器数据交互
  10. 28.XAPP1052驱动详解-WinDriver DMA读写流程
  11. FZUOJ 2214 Knapsack problem 背包
  12. ROCBOSS开源微社区轻论坛类源码
  13. echart图片库_基于html5 Canvas图表库 : ECharts
  14. ios: Undefined symbols
  15. 新辰:健身会所不是大人的菜 90后创业两年净赚20万
  16. ogg文件怎么转换为mp3格式?
  17. 中国互联网企业员工平均年龄出炉:字节跳动、拼多多最年轻仅 27 岁
  18. 攻防世界Reverse进阶区-EasyRE-writeup
  19. 启发国内学子学习少儿机器人编程教育
  20. 汉语是思维广阔敏捷的语言

热门文章

  1. IPC通信:Posix消息队列的属性设置
  2. [C++] - 闭包(closure)
  3. 运营管理整改报告范文_整改报告怎么写(安全检查整改报告范文)
  4. 【LeetCode】【HOT】617. 合并二叉树(递归)
  5. 【LeetCode】剑指 Offer 44. 数字序列中某一位的数字
  6. 《深入理解 Spring Cloud 与微服务构建》第二章 微服务应该具备的功能
  7. linux 权限管理命令
  8. 如何删除Smartphone手机与Office同步后的重复项,如联系人、日程等。Keyword:office,Outlook,删除,重复项目...
  9. .net Core 安装在linux上
  10. 【Codeforces Round #450 (Div. 2) B】Position in Fraction