CTC,RNA,RNN-T每次只读一个声学特征进来。

而Neural Transducer则是每次读多个声学特征进去,然后通过attention来选择读那些特征。

Neural Transducer的运作方式

累积一定数目的声学特征后, 构成一个window

接下来开始做decode,产生输出。输出的时候只在window的这个小范围内做attention。


这个window应该开多大呢?

Neural Transducer——李宏毅人类语言学习相关推荐

  1. Monotonic Chunkwise Attention(MoChA)——李宏毅人类语言处理

    其是想在attention上做一些改变,我们可以把他想成是动态的移动我们的window. here?:吃两个输入,z0和h,输出Yes/No,选择是否将window放在这里,如果No的话往右移动. 在 ...

  2. 李宏毅人类语言处理2020:Speech Separation

    目录 0. 背景知识补充 1. 鸡尾酒会问题 2. Speaker Separation 2.1 两人的单通道语音分离 2.2 评估指标 2.2.1 信噪比(signal-to-noise ratio ...

  3. 【深度学习人类语言处理】1 课程介绍、语音辨识1——人类语言处理六种模型、Token、五种Seq2Seq Model(LAS、CTC、RNN-T、Neural Transducer、MoChA)

    Deep Learning for Human Ianguage Processing 1. DLHLP-Introduction 1.1 概述 1.2 六种模型与应用 1.2.1 语音到文本 1.2 ...

  4. 课程向:深度学习与人类语言处理 ——李宏毅,2020 (P9)

    Language Modeling For Speech Recognition 李宏毅老师2020新课深度学习与人类语言处理课程主页: http://speech.ee.ntu.edu.tw/~tl ...

  5. 课程向:深度学习与人类语言处理 ——李宏毅,2020 (P22)

    Conditional Generation by RNN & Attention 李宏毅老师2020新课深度学习与人类语言处理课程主页: http://speech.ee.ntu.edu.t ...

  6. 课程向:深度学习与人类语言处理 ——李宏毅,2020 (P11)

    Voice Conversion 李宏毅老师2020新课深度学习与人类语言处理课程主页: http://speech.ee.ntu.edu.tw/~tlkagk/courses_DLHLP20.htm ...

  7. 课程向:深度学习与人类语言处理 ——李宏毅,2020 (P10)

    Voice Conversion 李宏毅老师2020新课深度学习与人类语言处理课程主页: http://speech.ee.ntu.edu.tw/~tlkagk/courses_DLHLP20.htm ...

  8. 课程向:深度学习与人类语言处理 ——李宏毅,2020 (P12)

    Speech Separation 李宏毅老师2020新课深度学习与人类语言处理课程主页: http://speech.ee.ntu.edu.tw/~tlkagk/courses_DLHLP20.ht ...

  9. 课程向:深度学习与人类语言处理 ——李宏毅,2020 (P17) 任务精简

    Overview of NLP Tasks 李宏毅老师2020新课深度学习与人类语言处理课程主页: http://speech.ee.ntu.edu.tw/~tlkagk/courses_DLHLP2 ...

  10. 课程向:深度学习与人类语言处理 ——李宏毅,2020 (P17) -2

    Overview of NLP Tasks 李宏毅老师2020新课深度学习与人类语言处理课程主页: http://speech.ee.ntu.edu.tw/~tlkagk/courses_DLHLP2 ...

最新文章

  1. 谷歌等揭露「AI任务疑难」:存在局限的ImageNet等基准,就像无法代表「整个世界」的博物馆...
  2. 强力攻城狮的职位要求...
  3. How to Avoid Producing Legacy Code at the Speed of Typing
  4. 怎么去掉ECSHOP的Powered by ECShop版权信息
  5. 第二章课后习题2-5
  6. 风电功率预测_人工智能在预测单机风电功率上的应用进展
  7. 超搞笑之仙桃有没有毛?
  8. 【Oracle】RAC集群中的命令
  9. Linux下安装qt5步骤
  10. 关于坐标系的那些事-------------扯一扯坐标系的理论知识
  11. 网络工程师(软考)学习笔记3--计算机网络体系结构2
  12. 《惢客创业日记》2020.08.01(周六)七月份的工作总结
  13. java小型计费系统设计_JAVA课程设计模拟电信计费系统
  14. 5月14日国内主流平台数字藏品发售日报
  15. azkaban报Error Chunking during uploading files to db
  16. 加拿大留学计算机专业好移民吗,加拿大最适合留学转移民的热门专业——计算机科学及信息技术...
  17. 十一、SpringCloud实用篇_Gateway服务网关
  18. android 图片叠加xml,Drawable子类之——LayerDrawable (图层叠加)
  19. 想知道香港汇丰银行如何开户吗?
  20. 全国344个主要城市(县)地图

热门文章

  1. 16种床上动作的内涵图,你都看懂了吗?
  2. 容斥原理解决某个区间[1,n]闭区间与m互质数数量问题
  3. centos7用html5播放器,centos7安装多媒体播放器SMPlayer
  4. 干货丨人大金仓KINGBASE云数据库全生命周期管理详解
  5. MTK摄像头调试工具 CCT 的使用
  6. 电子商务计算机和英语作文,电子商务的优缺点英语作文_电子商务英语作文
  7. 66ccff.xyz
  8. 带色彩恢复的多尺度视网膜增强算法(MSRCR)的原理、实现及应用。
  9. java使用HttpURLConnection检索网站时403错误处理方式
  10. Composer加载的symfony/var-dumper类库 字体大小样式设置