详解循环神经网络RNN（理论篇）

阅读大概需要10分钟

跟随小博主，每天进步一丢丢

作者刘博

链接 https://zhuanlan.zhihu.com/p/32755043

简介

让我们从一个问题开始，你能理解下面这句英文的意思吗？“working love learning we on deep”，答案显然是无法理解。那么下面这个句子呢？“We love working on deep learning”，整个句子的意思通顺了！我想说的是，一些简单的词序混乱就可以使整个句子不通顺。那么，我们能期待传统神经网络使语句变得通顺吗？不能！如果人类的大脑都感到困惑，我认为传统神经网络很难解决这类问题。

在日常生活中有许多这样的问题，当顺序被打乱时，它们会被完全打乱。例如，

我们之前看到的语言——单词的顺序定义了它们的意义
时间序列数据——时间定义了事件的发生
基因组序列数据——每个序列都有不同的含义

有很多这样的情况，序列的信息决定事件本身。如果我们试图使用这类数据得到有用的输出，就需要一个这样的网络：能够访问一些关于数据的先前知识（prior knowledge），以便完全理解这些数据。因此，循环神经网络（RNN）粉墨登场。

在这篇文章中，我假设读者了解神经网络的基本原理。

这就像将输入给隐藏层一样。在所有时间步（time steps）（后面会介绍什么是时间步），循环神经元的权重都是一样的，因为它现在是单个神经元。因此，一个循环神经元存储先前输入的状态，并与当前输入相结合，从而保持当前输入与先前输入的某些关系。

理解循环神经元（Recurrent Neuron）的细节

让我们先做一个简单的任务。让我们使用一个字符级别的RNN，在这里我们有一个单词“Hello”。所以我们提供了前4个字母h、e、l、l，然后让网络来预测最后一个字母，也就是“o”。所以这个任务的词汇表只有4个字母h、e、l、o。在涉及自然语言处理的实际情况中，词汇表一般会包括整个维基百科数据库中的单词，或一门语言中的所有单词。为了简单起见，这里，我们使用了非常小的词汇表。

让我们看看上面的结构是如何被用来预测“hello”这个单词的第五个字母的。在上面的结构中，蓝色RNN块，对输入和之前的状态应用了循环递归公式。在我们的任务中，字母“h”前面没有任何其他字母，我们来看字母“e”。当字母e被提供给网络时，将循环递归公式应用于输入（也就是字母e）和前一个状态（也就是字母h），得到新的状态。也就是说，在t-1的时候，输入是h，输出是,在t时刻，输入是e和，输出是,这里每次应用循环递归公式称为不同的时间步。

描述当前状态的循环递归公式如下：

这里是t时刻的状态, 是前一时刻的状态，是当前的输入。我们有的是前一时刻的状态而不是前一时刻的输入, 因为输入神经元将前一时刻的输入转换为前一时刻的状态。所以每一个连续的输入被称为时间步。

在我们的案例中，我们有四个输入（h、e、l、l），在每一个时间步应用循环递推公式时，均使用相同的函数和相同的权重。

考虑循环神经网络的最简单形式，激活函数是tanh，权重是,输入神经元的权重是,我们可以写出t时刻的状态公式如下

在上述情况下，循环神经元仅仅是将之前的状态考虑进去。对于较长的序列，方程可以包含多个这样的状态。一旦最终状态被计算出来我们就可以得到输出了。

现在，一旦得到了当前状态，我们可以计算输出了。

Ok，我们来总结一下循环神经元的计算步骤：

将输入时间步提供给网络，也就是提供给网络。
接下来利用输入和前一时刻的状态计算当前状态，也就是
当前状态变成下一步的前一状态
我们可以执行上面的步骤任意多次（主要取决于任务需要），然后组合从前面所有步骤中得到的信息。
一旦所有时间步都完成了，最后的状态用来计算输出
输出与真实标签进行比较并得到误差。
误差通过后向传播（后面将介绍如何后向传播）对权重进行升级，进而网络训练完成。

明日预告

详解循环神经网络RNN（实践篇）：

详解循环神经网络RNN（理论篇）相关推荐

一文详解循环神经网络的基本概念（代码版）
作者 | 李理目前就职于环信,即时通讯云平台和全媒体智能客服平台,在环信从事智能客服和智能机器人相关工作,致力于用深度学习来提高智能机器人的性能. 写在前面由于工作太忙,这个系列文章有一年多没有更 ...
[Python人工智能] 十二.循环神经网络RNN和LSTM原理详解及TensorFlow编写RNN分类案例
从本专栏开始,作者正式开始研究Python深度学习.神经网络及人工智能相关知识.前一篇讲解了TensorFlow如何保存变量和神经网络参数,通过Saver保存神经网络,再通过Restore调用训练好的 ...
循环神经网络(RNN, Recurrent Neural Networks)介绍
循环神经网络(RNN, Recurrent Neural Networks)介绍循环神经网络(Recurrent Neural Networks,RNNs)已经在众多自然语言处理(Natural ...
「NLP」深度学习NLP开篇-循环神经网络(RNN)
https://www.toutiao.com/a6714260714988503564/ 从这篇文章开始,有三AI-NLP专栏就要进入深度学习了.本文会介绍自然语言处理早期标志性的特征提取工具-循环 ...
【NLP】深度学习NLP开篇-循环神经网络(RNN)
从这篇文章开始,有三AI-NLP专栏就要进入深度学习了.本文会介绍自然语言处理早期标志性的特征提取工具-循环神经网络(RNN).首先,会介绍RNN提出的由来:然后,详细介绍RNN的模型结构,前向传播和 ...
Pytorch实现基本循环神经网络RNN (3)
1.47.Pytorch实现基本循环神经网络RNN (3) Recurrent Neural networks(Rumelhart, 1986)主要用来处理序列型数据,具有对以往数据的记忆功能.下图所 ...
循环神经网络(RNN)相关知识
文章目录 RNN概述前向传播公式通过时间反向传播(BPTT) RNN确定序列长度方式其他RNN结构基于RNN的应用 1,序列数据的分析 2,序列数据的转换 3,序列数据的生成 RNN的不足 1 ...
【从线性回归到卷积神经网络CNN 循环神经网络RNN Pytorch 学习笔记目录整合源码解读 B站刘二大人绪论（0/10）】
深度学习 Pytorch 学习笔记目录整合数学推导与源码详解 B站刘二大人目录传送门: 线性模型 Linear-Model 数学原理分析以及源码详解深度学习 Pytorch笔记 B站刘二大人( ...
循环神经网络——RNN的训练算法：BPTT
前文:循环神经网络--初学RNN https://blog.csdn.net/weixin_38522681/article/details/109129490 循环神经网络--RNN的训练算法:BP ...
通过keras例子理解LSTM 循环神经网络(RNN)
博文的翻译和实践: Understanding Stateful LSTM Recurrent Neural Networks in Python with Keras 正文一个强大而流行的循环神经 ...

详解循环神经网络RNN（理论篇）

目录

目录

详解循环神经网络RNN（理论篇）相关推荐

最新文章

热门文章