传统的Encoder-Decoder

1、在编码的时候,接收输入X=⟨x1,x2,…,xT⟩X=⟨x1,x2,…,xT⟩X=\langle x_1, x_2, \dots, x_T \rangle,生成context vector CCC
2、训练阶段,在解码的时候

2.1、从CCC出发预测ŷ 1y^1\hat{y}_1,再依次用ŷ i−1y^i−1\hat{y}_{i-1}预测ŷ iy^i\hat{y}_i,即使用预测的Ŷ Y^\hat{Y}而不是真实值YYY,这样的做法就是让模型自己去学习。这样容易产生误差累积的问题,导致模型学习收敛比较慢。

2.2、如果每次使用真实值的yi−1yi−1y_{i-1}来作为输入生成预测值ŷ iy^i\hat{y}_i,这样的做法就是teacher forcing,也就是加入教师强制指导,这样的好处就是更快的收敛,但是更偏向于单个正确值预测,而在测试的时候这种教师信息是没有的,因此可能导致模型的泛化能力不够。

3、因此可以设定一个比例,作为两种方式的折中

NMT、enc-dec的一些笔记相关推荐

  1. 《Introduction To Modern Cryptography》读书笔记二

    <Introduction To Modern Cryptography>读书笔记二 本笔记纯粹个人读书习惯与相应见解,内容归纳完全出于个人需要与个人局限,如有修改意见(比如哪儿应该是值得 ...

  2. 斯坦福密码学课程-笔记-02-Stream Ciphers流密码

    斯坦福密码学课程笔记 02-流密码 Stream Ciphers The One Time Pad Symmetric Ciphers: definition The One Time Pad (Ve ...

  3. PredNet阅读笔记——从视频预测的角度学习视频表征

    看到有网站未经允许转载了,无奈加个原文地址:http://blog.csdn.net/zhangsipppcsdn/article/details/69907598 ICLR 2017论文<De ...

  4. 文献阅读笔记:Unsupervised Machine Translation Using Monolingual Corpora Only

    文章目录 0. 背景 0.1 摘要 1. 介绍 2. 无监督神经机器翻译 2.1 神经机器翻译模型 2.2 模型概述 2.3 降噪自编码 2.4 跨域训练 2.5 对抗训练 3. 训练 3.1 迭代训 ...

  5. 【Joy of Cryptography 读书笔记】Chapter 1 一次性密码本(one-time pad)Kerckhoffs原则

    Chapter 1 一次性密码本(one-time pad)&Kerckhoffs原则 文章目录 Chapter 1 一次性密码本(one-time pad)&Kerckhoffs原则 ...

  6. 现代密码学3.7--CCA安全

    现代密码学3.7--CCA安全 CCA安全 含oracle的实验过程PrivKA,Πcca(n)PrivK^{cca}_{\mathcal{A},\Pi}(n)PrivKA,Πcca​(n) CCA安 ...

  7. 现代密码学3.4--CPA安全,多次加密

    现代密码学3.4--CPA安全,多次加密 CPA安全 oracle 例子 含oracle的实验过程 CPA安全定义 多次加密的CPA安全 "left-or-right" oracl ...

  8. 玩转华为ENSP模拟器系列 | 两个网关之间利用Tunnel接口实现IPSec VdPdNd隧道多链路备份

    素材来源:华为防火墙配置指南 一边学习一边整理试验笔记,并与大家分享,侵权即删,谢谢支持! 附上汇总贴:玩转华为ENSP模拟器系列 | 合集_COCOgsta的博客-CSDN博客_华为模拟器实验 目标 ...

  9. Pytorch学习记录-torchtext和Pytorch的实例( 使用神经网络训练Seq2Seq代码)

    Pytorch学习记录-torchtext和Pytorch的实例1 0. PyTorch Seq2Seq项目介绍 1. 使用神经网络训练Seq2Seq 1.1 简介,对论文中公式的解读 1.2 数据预 ...

最新文章

  1. oracle解析xml字符串命名空间,XML命名空间
  2. pthread_create()之前的属性设置
  3. python读文件操作-python文件操作-读写删除复制总结
  4. 微软人工智能和对话平台--知识商城体验
  5. 433M数传电台窄带无线通讯技术手册
  6. 冒充“老干妈”公司工作人员行骗三人被提起公诉
  7. 北京Uber优步司机奖励政策(4月7日)
  8. 能安装python库的app_APP自动化之安装Python(类库)环境
  9. LabView学习笔记(八):属性节点
  10. python标准库time_python标准库介绍——12 time 模块详解
  11. 2020CID|阿里云韩伟东:云原生底层系统思考
  12. word文档怎么压缩大小?
  13. OpenGL_10 3D空间中移动图像
  14. pip install paddlepaddle 报错 command ‘/usr/bin/gcc‘ failed with exit code 1 或 command ‘gcc‘ 报错
  15. Python有趣|数据分析三板斧
  16. 乐视账号服务器关闭,乐视手机重置后无法登录账号 官方给出解决方案
  17. OpenWRT之UCI系统
  18. 微信小程序布局-图片+文字
  19. linux RAID管理与恢复误删除文件
  20. 【Python】Scrapy完成电影信息爬取并存入数据库

热门文章

  1. OCR性能优化:从认识BiLSTM网络结构开始
  2. [Linux]什么是Linux根社区
  3. 第八章:对象、类与面向对象编程
  4. H5播放SVGA动画
  5. 无线网服务器mac是什么原因,为何mac连上wifi却上不了网
  6. 计算机考研视频哪个机构的好,计算机考研考点教学视频哪个好
  7. dropzone java实例_Java实现拖拽文件上传dropzone.js的简单使用示例代码
  8. SAP 收入成本不配比是否启用发出商品科目以及差异分摊处理方案
  9. 腾讯QQ2007 beta1┊解决Windows Vista下QQ基本的兼容性问题┊纯净绿色特别版
  10. ubuntu 14.04解压zip文件出现乱码