原文链接:seq2seq model in Machine Learning

seq2seq 首次被谷歌引用是用于机器翻译。在那之前的翻译方式十分朴素。敲入的每个单词会被忽视语法和上下文直接转换成目标语言。seq2seq 利用深度学习革新了这种翻译过程。它在翻译时不仅会考虑当前的输入,还会考虑邻居。

现在 seq2seq有了更广泛的应用,如图像描述、对话模型、文本总结等。

seq2seq的工作过程:

顾名思义,seq2seq将词序列(一个或多个句子)作为输入,再输出一个词序列。它通过一个循环神经网络做到。现在循环神经网络的基础版本已经少用,多用的是它的进阶版本长短期记忆网络或者门控制单元。这是因为基础的循环神经网络有梯度爆炸的缺陷。谷歌提出的(seq2seq)版本用的是长短期记忆网络。它发展单词上下文的方法是在每个时间点采用两个输入。一个来自用户,一个来自先前的输出,因此名字里面有循环(输出被作为输入)。

它主要由编码器和解码器两部分组成,因此有时被称作编解码器网络。

编码器:采用深神经网络层次,将输入的若干单词转化成相应的隐藏层向量。每个向量表示当前单词及该单词的上下文。

解码器:和编码器的工作过程相似。它将编码器生成的隐藏层向量、它自身的隐藏状态和当前单词作为输入,输出下一个隐藏层向量,最终预测出下一个单词。

除了上述两个组成要素,seq2seq 还做出了以下优化:

注意力(Attention):解码器的输入是单个向量,存储了有关上下文的全部信息。这样长序列的输入成为问题。注意力机制的引入让解码器能够对输入的序列有选择性地观察。

定向搜索(Beam Search):可能性最大的单词会被解码器选作输出。但是这样做存在贪心算法的通病,即并不总是产生最好的结果。定向搜索因此被用在每一步,来提示可能的翻译。具体做法是建立一棵由k个最佳结果组成的树。

装桶(Bucketing):对于seq2seq模型来说各种长度的序列都是可能的,因为在输入和输出时都存在0填充(the padding of 0’s不知翻译得是否准确)。可一旦最大长度被我们设为100,而序列只有3个单词就会造成大量的浪费。因此我们采用装桶的概念。我们制作不同尺寸的桶,如(4,8)(8,15)等等其中4是最大输入长度,8是最大输出长度。

翻译:seq2seq model in Machine Learning相关推荐

  1. ML:MLOps系列讲解之《基于ML的软件的三个层次之02 Model: Machine Learning Pipelines——2.6 ML Model serialization forma》解读

    ML:MLOps系列讲解之<基于ML的软件的三个层次之02 Model: Machine Learning Pipelines--2.6 ML Model serialization forma ...

  2. ML:MLOps系列讲解之《基于ML的软件的三个层次之02 Model: Machine Learning Pipelines——2.5 Different forms of ML workfl》解读

    ML:MLOps系列讲解之<基于ML的软件的三个层次之02 Model: Machine Learning Pipelines--2.5 Different forms of ML workfl ...

  3. ML:MLOps系列讲解之《基于ML的软件的三个层次之02 Model: Machine Learning Pipelines 2.1~2.4》解读

    ML:MLOps系列讲解之<基于ML的软件的三个层次之02 Model: Machine Learning Pipelines 2.1~2.4>解读 目录 <基于ML的软件的三个层次 ...

  4. 最详尽翻译:Rules of Machine Learning: Best Practices for ML Engineering

    原文地址:https://developers.google.com/machine-learning/rules-of-ml/ 作者:Martin Zinkevich ##前言 Google大佬Ma ...

  5. MLY翻译 -- 4.Scale drivers machine learning progress

    深度学习(神经网络)的很多想法已经存在几十年了,为什么这些想法现在才流行起来? 促使机器学习进来的进步的两大因素是: 可得到的数据.现在,人们会花费更多的时间在数字设备上(例如笔记本,手机).人们的数 ...

  6. 解密谷歌机器学习工程最佳实践——机器学习43条军规 翻译 2017年09月19日 10:54:58 98310 本文是对Rules of Machine Learning: Best Practice

    解密谷歌机器学习工程最佳实践--机器学习43条军规 翻译 2017年09月19日 10:54:58 983 1 0 本文是对Rules of Machine Learning: Best Practi ...

  7. AI:Algorithmia《2021 enterprise trends in machine learning 2021年机器学习的企业趋势》翻译与解读

    AI:Algorithmia<2021 enterprise trends in machine learning 2021年机器学习的企业趋势>翻译与解读 目录 <2021 ent ...

  8. AI:Algorithmia《2020 state of enterprise machine learning—2020年企业机器学习状况》翻译与解读

    AI:Algorithmia<2020 state of enterprise machine learning-2020年企业机器学习状况>翻译与解读 目录 <2020 state ...

  9. Paper:《A Few Useful Things to Know About Machine Learning—关于机器学习的一些有用的知识》翻译与解读

    Paper:<A Few Useful  Things to  Know About  Machine  Learning-关于机器学习的一些有用的知识>翻译与解读 目录 <A Fe ...

最新文章

  1. 模型加速--Slimmable neural networks
  2. QT下 cannot find -IGL的解决办法
  3. hdu 4391 Paint The Wall 线段树 +优化 2012 Multi-University Training Contest 10 )
  4. 数据科学近3年都应用在哪些领域?
  5. 2120: 数颜色(带修莫队)
  6. python约瑟夫环单向循环链表_约瑟夫环_约瑟夫环单向循环链表_约瑟夫环c语言循环链式...
  7. 1、RH850时钟源及配置
  8. oracle写存储过程ssm中调用存储过程
  9. 2022谷粒商城学习笔记(二十五)支付宝沙箱模拟支付
  10. 代购类网站商品高清晰大图片(1000x1000)的采集解决方案 - hackercai - 博客园
  11. python截图(长图和短图)方法封装
  12. Uptime Kuma一款开源监控工具
  13. Javase day06_汇总
  14. git使用进阶(一)
  15. 3GPP TS 23501-g51 中英文对照 | 4.4.2 SMS over NAS
  16. ods mysql_ODS数据抽取平台
  17. 学习笔记-Java并发(一)
  18. pq法潮流计算matlab,基于MATLAB电力系统PQ潮流计算程序设计(范文1)
  19. Java接入PayPal教程,Spring boot Demo源码,企业账号注册,支付,回调,退款全流程,最新PayPal SDK
  20. 农业温室大棚养殖系统智能监控方案

热门文章

  1. 厉害了,Python也能操作注册表
  2. Facade和Adapter
  3. 使用NPOI按照word模板文件生成新的word文件
  4. Win11 PS2022 打开文件闪退
  5. 【matlab教程】11、动态数组
  6. java毕业生设计弹幕视频网站计算机源码+系统+mysql+调试部署+lw
  7. windows常用脚本bat合集
  8. 初次接触tridium niagara软件
  9. 机器学习:线性回归以及非线性回归
  10. ZYNQ开发系列——hw_platform包和BSP包中的一些理解