本系列博客由 罗周杨 stupidme.me.lzy@gmail.com 原创,分享或转载请注明作者和原出处。

NMT即Neural Machine Translation,神经网络机器翻译。Google开源的tensorflow机器学习框架中,提供了一个NMT的实现。NMT使用seq2seq模型。将一个序列转化为另一个序列。凡是符合此特征的实际问题,均可以使用seq2seq模型。因此常见的机器翻译,文本摘要和对话机器人等常常使用seq2seq模型。

Google提供的nmt demo对seq2seq模型也有介绍,请参考项目地址的首页README文档。

Google提供的nmt代码开源在GitHub,请访问 tensorflow/nmt。

本博客将带领大家从源码上入手NMT模型,在讲解代码的同时,介绍一些相关的数学原理。

本博客是一个系列文章, 分成以下几个部分:

  • tensorflow/nmt 的开发环境搭建
  • tensorflow/nmt 的整体结构
  • tensorflow/nmt 的超参数
  • tensorflow/nmt 的数据处理过程
  • tensorflow/nmt 的基本模型
  • tensorflow/nmt 的attention模型
  • tensorflow/nmt 的gnmt模型
  • tensorflow/nmt 的训练模型
  • tensorflow/nmt 的推断模型
  • tensorflow/nmt 的训练示例
  • tensorflow/nmt 的推断示例
  • tensorflow/nmt 的模型部署到tensorflow serving

联系我

如果你发现博客内容有不对或者说的不清楚的地方,请联系我,我将第一时间改正,尽我的最大能力将问题讲清楚。

Email: stupidme.me.lzy@gmail.com
WeChat: luozhouyang0528

以下是我的公众号,不定期和大家分享技术文章。如果你觉得我的文章对你有帮助,麻烦关注一下哟:

Tensorflow nmt源码解析相关推荐

  1. tensorflow 启动多个session_Tensorflow源码解析7 -- TensorFlow分布式运行时

    1 概述 TensorFlow架构设计精巧,在后端运行时这一层,除了提供本地运行时外,还提供了分布式运行时.通过分布式训练,在多台机器上并行执行,大大提高了训练速度.前端用户通过session.run ...

  2. oracle job 每月前十天运行_Tensorflow源码解析7 -- TensorFlow分布式运行时

    1 概述 TensorFlow架构设计精巧,在后端运行时这一层,除了提供本地运行时外,还提供了分布式运行时.通过分布式训练,在多台机器上并行执行,大大提高了训练速度.前端用户通过session.run ...

  3. [源码解析] TensorFlow 分布式之 MirroredStrategy 分发计算

    [源码解析] TensorFlow 分布式之 MirroredStrategy 分发计算 文章目录 [源码解析] TensorFlow 分布式之 MirroredStrategy 分发计算 0x1. ...

  4. [源码解析] TensorFlow 分布式之 ClusterCoordinator

    [源码解析] TensorFlow 分布式之 ClusterCoordinator 文章目录 [源码解析] TensorFlow 分布式之 ClusterCoordinator 1. 思路 1.1 使 ...

  5. 谷歌BERT预训练源码解析(二):模型构建

    版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/weixin_39470744/arti ...

  6. 谷歌BERT预训练源码解析(一):训练数据生成

    目录 预训练源码结构简介 输入输出 源码解析 参数 主函数 创建训练实例 下一句预测&实例生成 随机遮蔽 输出 结果一览 预训练源码结构简介 关于BERT,简单来说,它是一个基于Transfo ...

  7. The Wide and Deep Learning Model(译文+Tensorlfow源码解析) 原创 2017年11月03日 22:14:47 标签: 深度学习 / 谷歌 / tensorf

    The Wide and Deep Learning Model(译文+Tensorlfow源码解析) 原创 2017年11月03日 22:14:47 标签: 深度学习 / 谷歌 / tensorfl ...

  8. 判定两个tensor维度相同_Tensorflow源码解析5 -- 图的边 - Tensor

    1 概述 前文两篇文章分别讲解了TensorFlow核心对象Graph,和Graph的节点Operation.Graph另外一大成员,即为其边Tensor.边用来表示计算的数据,它经过上游节点计算后得 ...

  9. SSD( Single Shot MultiBox Detector)关键源码解析

    SSD(SSD: Single Shot MultiBox Detector)是采用单个深度神经网络模型实现目标检测和识别的方法.如图0-1所示,该方法是综合了Faster R-CNN的anchor ...

最新文章

  1. djc加密数字货币_清华大学《区块链和加密数字货币》课程线上开课,与李礼辉、姚前等大佬一起交流学习吧...
  2. Metasploit-MS17-010利用
  3. effective c#读书笔记之二 静态成员的初始化
  4. C#使用SQL语句时候的万用密码问题
  5. 恶意网址提醒服务见实效
  6. xmanager远程登录
  7. kafka reassign 限速_RabbitMQ 与 Kafka 的技术差异以及使用注意点
  8. 李沐老师的《动手学深度学习PyTorch》中的d2lzh_python包的安装
  9. svn ignore 的用法
  10. linux内存管理详解,Linux内存管理图文讲解.pdf
  11. 电大考计算机和英语,2016年电大+年电大计算机_英语_网考小抄.doc
  12. hackerrank初级篇之Plus Minus
  13. IIC详解之AT24C08
  14. windows提示“为了对电脑进行保护,已经阻止此应用”的解决方案 mmc.exe
  15. Ckplayer试看功能
  16. 手机微信如何打开html文件,手机上怎么找微信里的电子文件
  17. 使用终端模拟器通过wifi连接eclipse
  18. Simulink-模块Moudle调用回调函数步骤
  19. LAYA和TypeScript制作H5入门——页面制作
  20. html5手机网站需要加的那些meta标签,手机网站自适应

热门文章

  1. 修复handsontable自动完成不支持中文的bug
  2. 三、索引优化(3)聚集索引上的非聚集索引
  3. Linux命令之uname
  4. 进程间通信(IPC)学习
  5. 论分层思想在各行各业的应用
  6. Java架构-薪水增长多少,新机会才值得考虑?
  7. nginx安装-添加MP4播放模块
  8. iBATIS In Action:使用映射语句(一)
  9. django ---- models继承
  10. 如何用java语法解析接口返回的json串?