论文阅读:FASTEMIT: LOW-LATENCY STREAMING ASR WITH SEQUENCE-LEVEL EMISSION REGULARIZATION

下载链接:https://arxiv.org/abs/2010.11148

主要概要:

本篇文章主要是介绍了一种名为FastEmit的正则化方法,以减少end-to-end streaming ASR的解码延时。

主要内容:

               

  1. 解码时前向后向算法会计算所有的可能路径,可能经过blank,也可能经过label,算法的目的是最大化概率的路径:

如图一所示,红色为正常的解码路径,其中红色路径会经过很多的blank,路径更长,因此是slow emit;而绿色路径没有经过blank就直接得到了解码结果,这条路径更短,解码时间更快,因此是fast emit。 所以解码时我们更希望模型偏向于选择fast emit。

2.    所以,当图二所示的蓝色点在选择向上或者向右的时候,我们希望它向上走,于是更加鼓励模型预测label而不是blank。得到如下的loss 函数,其中是hyper-parameter to balance the transducer loss and regularization loss.  是预测为label的概率。

论文阅读:FASTEMIT: LOW-LATENCY STREAMING ASR WITH SEQUENCE-LEVEL EMISSION REGULARIZATION相关推荐

  1. 【论文阅读】Decision Transformer: Reinforcement Learning via Sequence Modeling

    [论文阅读]Decision Transformer: Reinforcement Learning via Sequence Modeling 1 本文解决了什么问题? 本文将强化学习抽象为一个序列 ...

  2. 论文阅读【Controllable Video Captioning with POS Sequence Guidance Based on Gated Fusion Network】

    Controllable Video Captioning with POS Sequence Guidance Based on Gated Fusion Network 概述 发表:ICCV 20 ...

  3. 论文阅读 (76):Anomaly Detection in Video Sequence with Appearance-Motion Correspondence

    文章目录 1 概述 1.1 题目 1.2 摘要 1.3 代码 1.4 引用 2 方法 2.1 初始模块 (Inception module) 2.2 外观卷积自编码器 (Conv-AE) 2.3 动作 ...

  4. HLA-Face: Joint High-Low Adaptation for Low Light Face Detection论文阅读笔记

    HLA-Face: Joint High-Low Adaptation for Low Light Face Detection 论文阅读笔记 这是去年7月读这篇文章的笔记了,今年由于忘记了,又有需要 ...

  5. 语音识别(ASR)论文优选:端到端ASR综述Recent Advances in End-to-End Automatic Speech Recognition

    声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵.搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html.语音合成领域论文列表请访问h ...

  6. 深度学习论文阅读目标检测篇(四)中英文对照版:YOLOv1《 You Only Look Once: Unified, Real-Time Object Detection》

    深度学习论文阅读目标检测篇(四)中英文对照版:YOLOv1< You Only Look Once: Unified, Real-Time Object Detection> Abstra ...

  7. [论文阅读] (12)英文论文引言introduction如何撰写及精句摘抄——以入侵检测系统(IDS)为例

    <娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...

  8. [论文阅读] (14)英文论文实验评估(Evaluation)如何撰写及精句摘抄(上)——以入侵检测系统(IDS)为例

    <娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...

  9. Octopus FS 论文阅读 (一)

    Octopus 论文阅读 Octopus: an RDMA-enabled Distributed Persistent Memory File System 论文阅读 摘要 共享内存池减少memor ...

最新文章

  1. 基于深度学习Superpoint 的Python图像全景拼接
  2. Python进阶2——向量模拟
  3. 如何使用Visual Studio 2010(VS2010)编译C语言
  4. 计算机操作系统_计算机理论(操作系统概念及常见操作系统类型)
  5. Kotlin极简教程:第4章 基本数据类型与类型系统
  6. selenium模拟鼠标和键盘操作的基本方法
  7. 百度三轮面试回来,想和Java程序员分享一下。
  8. reading notes -- Amazon.com Recommendations: Item-to-Item Collaborative Filtering
  9. 上海交通大学软件学院2005学年度第一学期工程硕士课程安排表
  10. 手机快充功能到底是充电头的功劳还是线的功劳?
  11. 排名怎么查_公布考研成绩排名?怎么查?
  12. MVCJSONJQuery分页实现
  13. 台达服务器AB和B2系列区别,台达伺服各系列区别
  14. Vm虚拟机安装Linux系统教程
  15. 淘宝/天猫上传图片到淘宝 API
  16. 硅谷之行 (15) Fremont观豪宅
  17. 在Windows和macOS上更新Node.js到最新版本
  18. 网易工程师亲历:一次sql缺少where条件的惨案…
  19. python实现conv(卷积),dept_conv(通道卷积),batchnorm(批量归一化)的前向过程(一)
  20. 谈谈字符集和字符编码

热门文章

  1. 隐藏控制台程序的dos窗口
  2. c语言如何画简单图形,如何用C语言画基本图形
  3. 计算机软考证书全面分析
  4. 英语作业介绍一项发明计算机,计算机专业英语第1次作业.doc
  5. iOS开发支付集成之支付宝支付
  6. Flask Docker Hello Word
  7. WARN Error while fetching metadata with correlation id 1 : {first=LEADER_NOT_AVAILABLE} (org.apache.
  8. 采用两块半球体U235金属的原子弹
  9. Scala初级实践——统计手机耗费流量(1)
  10. pytorch加载训练数据集dataloader操作耗费时间太久,该如何解决?