理解RTF和RTX

  • RTF(real_time_factor实时率,在线识别指标)
  • RTX(real_time_x实时效率,离线转写指标)
  • Reference

RTF(real_time_factor实时率,在线识别指标)

RTF(real time factor)表示如下:
RTF=ASR识别所有音频处理时间(单位秒)所有音频总时间(单位秒)RTF=\frac{ASR识别所有音频处理时间 (单位秒)}{所有音频总时间 (单位秒)} RTF=所有音频总时间(单位秒)ASR识别所有音频处理时间(单位秒)​
【意义】平均1秒时长音频ASR算法需要多少秒处理,小于1才能达到实时效果。越小越好,正常0.2-0.3
          该指标针对的是在线ASR识别指标
具体见官方代码(参考文献):

 BaseFloat frame_shift = 0.01;BaseFloat real_time_factor =global_timer.Elapsed() / (frame_shift * num_frames);if (num_frames > 0)KALDI_LOG << "Real-time factor was " << real_time_factor<< " assuming frame shift of " << frame_shift;

另外一段代码(参考文献):

double real_time_factor = total_time_taken_ / total_audio_,average_wait = (total_time_taken_ - total_audio_) / num_utts_,idle_proportion = total_time_waited_ / total_audio_,idle_percent = 100.0 * idle_proportion;
    double elapsed = timer.Elapsed();KALDI_LOG << "Time taken "<< elapsed<< "s: real-time factor assuming 100 frames/sec is "<< (elapsed*100.0/frame_count);

【注解】 会发现上面三段代码都是一个意思
real_time_factor=total_time_takentotal_audio=total_time_takenframe_shift⋅num_frames=total_time_taken0.01⋅num_frames=100⋅total_time_takennum_frames\begin{aligned} real\_time\_factor & = \frac{total\_time\_taken}{total\_audio} \\ & = \frac{total\_time\_taken}{frame\_shift \cdot num\_frames} \\ & = \frac{total\_time\_taken}{0.01 \cdot num\_frames} \\ & = \frac{100 \cdot total\_time\_taken}{num\_frames} \\ \end{aligned} real_time_factor​=total_audiototal_time_taken​=frame_shift⋅num_framestotal_time_taken​=0.01⋅num_framestotal_time_taken​=num_frames100⋅total_time_taken​​
即:音频总时长=total_audio=frame_shift⋅num_frames=0.01⋅num_frames\color{red}音频总时长=total\_audio = frame\_shift \cdot num\_frames=0.01 \cdot num\_frames音频总时长=total_audio=frame_shift⋅num_frames=0.01⋅num_frames


RTX(real_time_x实时效率,离线转写指标)

RTX(real time x)表示如下:
RTX=所有音频总时间(单位秒)ASR识别所有音频处理时间(单位秒)RTX=\frac{所有音频总时间 (单位秒)}{ASR识别所有音频处理时间 (单位秒)} RTX=ASR识别所有音频处理时间(单位秒)所有音频总时间(单位秒)​
【意义】平均1秒时间内我们的ASR算法可以处理多长时间的音频,越大越好,正常在GPU上是500多
参考代码:

KALDI_LOG << "Overall: "<< " Aggregate Total Time: " << total_time<< " Total Audio: " << total_audio * iterations<< " RealTimeX: " << total_audio * iterations / total_time;

Reference

online-timing.cc
online2-wav-nnet2-latgen-threaded.cc
gmm-latgen-simple.cc
batched-wav-nnet3-cuda.cc

理解RTF和RTX指标相关推荐

  1. 深入理解人工智能模型能力指标F1的具体意义

    文章目录 简介 示例 结论 简介 在对人工智能训练能力水平评估的标准中,准确性(Accuracy),精准度(Precision),召回率(Recall)和 综合指标 F1. 三前者相对比较好理解,基具 ...

  2. 理解OBV能量潮指标 for quant

    OBV Investopedia StockCharts DayTrading.com Fidelity 极少人知道的OBV能量潮指标,威力巨大 On-Balance Volume(OBV), dev ...

  3. 想要系统稳定?最好用也最容易理解的指标是.....

    在金融行业里,大家对于系统稳定运行比精准运行,更迫切的需求.这也是为什么位于国内四大行之首的工商银行,后台业务系统还是多年没升级.原因之一是考虑到系统需要稳定运行. 在风险管理上,对于稳定性的监控也十 ...

  4. 围城书评_软件开发指标的问答和书评

    围城书评 Dave Nicolette撰写的<软件开发度量>一书探讨了如何使用度量来跟踪和指导软件开发. 它说明了不同的开发方法和过程模型(例如传统的基于瀑布的迭代软件或迭代式敏捷软件开发 ...

  5. 【java 性能优化实战】1 理论分析:性能优化,有哪些衡量指标、性能优化的技术手段

    指标是我们衡量很多事物,以及做出行为决策的重要参考.例如在生活中,当你打算买汽车时,会关注很多指标,比如动力性.燃油经济性.制动性.操纵稳定性.平顺性.通过性.排放与噪声等,而这些指标也都有相关的测试 ...

  6. DeepMind论文解读:让机器更深入地理解文本

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  7. 激活策略 查询_5个提问,详细介绍北极星指标的策略框架

    北极星指标(North Star Metric)已经逐渐成为许多公司指导产品发展的重要指标,本文通过五个设问和多个行业案例,系统性地介绍北极星指标这类产品策略框架. 如今有非常多的人在谈论和使用北极星 ...

  8. php 选股器,RSI切线突破选股指标(TDX)..

    本帖最后由 yinchoo 于 2009-7-25 09:10 编辑 1.对于RSI指标的运用请查坛中伟哥.井中月.cqcsshw .九阳 等高手的贴子: http://www.stockwei.co ...

  9. 论文浅尝 | 对于知识图谱嵌入表示的几何形状理解

    论文链接:http://anthology.aclweb.org/attachments/P/P18/P18-1012.Presentation.pdf 发表会议:ACL 2018 摘要 知识图谱的嵌 ...

最新文章

  1. Windows 10企业批量部署实战之WDS安装
  2. selenium之定位以及切换frame
  3. centos7 安装oracle jdk 与openjdk 实现切换
  4. MAS 714课程笔记12: 线性规划
  5. linux fedora35让GRUB 2记住上一次启动的操作系统
  6. JPA教程–在Java SE环境中设置JPA
  7. 华为2017java笔试题_2017年java华为面试题
  8. java getcause_java - 如果在异常上调用getCause(),为什么还要处理Throwable - 堆栈内存溢出...
  9. 如何在 16 英寸 MacBook Pro 内置或独立显示器上更改刷新率?
  10. UITableView的cell重用优化
  11. 网页设计作业作品成品HTML5+CSS大作业——简单的程序员个人博客(7页) 大学个人博客网页制作教程 表格布局网页模板
  12. 如何成为优秀的技术主管?你要做到这三点
  13. Office 2010 excel在打开两个表格的时候,仅能在一个窗口显示
  14. Transformer Decoder
  15. 白岩松:不平静,就不会幸福
  16. 网络重置后WLAN网络找不到怎么办?
  17. 【代码审计】那些代码审计的思路.md
  18. 王阳明心学 量子物理_量子物理学论文的文本分类
  19. c++-printf详解
  20. 数据结构考研(转载请标明出处,学习辛苦整理)

热门文章

  1. 安卓各国语言对应缩写和时区查询
  2. 渗透中超全的Google hack语法
  3. VGG 图像打标签工具
  4. 【C++】C++格式化输出/输出格式控制/输出精度控制
  5. 人工智能——课程论文
  6. SCAFFOLD: Stochastic Controlled Averaging for Federated Learning
  7. Mac下eclipse安装和配置Tomcat
  8. 禁止移动端微信内置浏览器调节字体大小
  9. oracle期末考试参考答案
  10. 当配置邮箱第三方SMTP 说短信内容有误的时候