摘要:循环神经网络(RNN)可是在语音识别、自然语言处理等其他领域中引起了变革!

本文分享自华为云社区《【MindSpore易点通】深度学习系列-循环神经网络上篇》,作者:Skytier

循环神经网络(RNN)可是在语音识别、自然语言处理等其他领域中引起了变革!

1 应用场景

循环神经网络(RNN)其实就是序列模型,我们先来看看其应用场景。

在语音识别时,给定了一个输入音频片段X ,并要求输出对应的文字记录Y 。这里的输入和输出数据都是序列模型,输入X是一个按时播放的音频片段,输出Y是一系列文字。

音乐生成问题也是一样,输出数据Y是序列,而输入数据X可以是空集,也可以是个单一的整数(代表音符)。

而系列模型在DNA序列分析中也十分有用,DNA可以用A、C、G、T四个字母来表示。所以给定一段DNA序列,你能够标记出哪部分是匹配某种蛋白质的吗?

以上所有类似问题都可以被称作使用标签数据(X,Y)作为训练集的监督学习,输入数据X或者输出数据Y是序列,即使两者都是序列也有数据长度不同的问题。

2 模型构建

比如建立一个序列模型,它的输入语句是这样的:“Sam Li and Tom date on Tuesday.”。然后模型是可以自动识别句中人名位置的命名实体识别模型,可以用来查找不同类型的文本中的人名、公司名、时间、地点、国家名和货币名等等。

假定输入数据x,序列模型的输出y,使得输入的每个单词都对应一个输出值,同时y还需要表明输入的单词是否是人名的一部分。

首先输入语句是7个单词组成的时序序列,所以最终会有7个特征集x:x<1>,x<2>,...,x<7>,同时可以索引其序列中的位置。Tx表示输出序列的长度,这里Tx=7。

同理,输出数据也是一样,分别对应y<1>,y<2>,...,y<7>,Ty表示输出序列的长度。

那么问题来了,首先我们需要准备一个比较大的词典库,可能该库里的第一个单词是a,and出现在第367个位置上,Sam是在7459这个位置,Tom则在8674。

那么我们就可以在这个词典库的基础上遍历训练集。

那么也就是说,Sam由x<1>表示,其是一个第7459行是1,其余值都是0的向量;Li由x<2>表示,其是一个第2420行是1,其余值都是0的向量。

通常我们称这种x指代句子里的任意词为one-hot向量,只有一个值是1,其余值都是0,所以整句话中我们会有7个one-hot向量,用序列模型在X和Y目标输出之间学习建立一个映射关系。

PS:如果遇到了一个在你词表中的单词,可以创建一个Unknow Word的伪造单词,用<UNK>作为标记。

3 模型解释

通常情况下,我们会首先选取标准的神经网络,输入7个one-hot向量,经过一些隐藏层,最终会输出7个值为0或1的项,表明每个输入单词是否是人名的一部分。

但最后我们总会遇到这样的问题:

1.输入和输出数据的长度并不完全一致,即使采用填充(pad)或零填充(zero pad)使每个输入语句都达到最大长度,但最后的表达式会很奇怪。

2.简单的神经网络并不会共享从文本的不同位置上学到的特征。因为我们希望,如果首次学习的时候我们已经知道了Tom是人名,那么当Tom出现在其他位置时,其并不能够自动识别,因此也不能够减少模型中参数的数量。

那么循环神经网络为啥会比普通的神经网络更加出众呢?

另外循环神经网络是从左向右扫描数据,同时每个时间步的参数也是共享的,用Wax来表示从x<1>到隐藏层的连接的一系列参数,每个时间步使用的都是相同的Wax参数,而激活值是由参数Waa决定的,输出结果由Way决定。

先输入零向量a<0>,接着进行前向传播过程,计算激活值a<1>,然后再计算y<1>。

更普遍来说,在t时刻:

为了更加简化一点,定义Wa:

,假设a是100维的,x是10,000维的,那么Waa是(100,100)维的矩阵,Wax是(100,10000)维,Wa为(100,10100)。

同样,假定

,Wy表明它是计算y类型的量的权重矩阵,而Wa和ba则表示这些参数是用来计算激活值的。

RNN前向传播示意图:

点击关注,第一时间了解华为云新鲜技术~

一文了解循环神经网络相关推荐

  1. 一文搞懂RNN(循环神经网络)

    基础篇|一文搞懂RNN(循环神经网络) https://mp.weixin.qq.com/s/va1gmavl2ZESgnM7biORQg 神经网络基础 神经网络可以当做是能够拟合任意函数的黑盒子,只 ...

  2. MLK | 一文理清深度学习循环神经网络

    MLK,即Machine Learning Knowledge,本专栏在于对机器学习的重点知识做一次梳理,便于日后温习,内容主要来自于<百面机器学习>一书,结合自己的经验与思考做的一些总结 ...

  3. 一文详解循环神经网络的基本概念(代码版)

    作者 | 李理 目前就职于环信,即时通讯云平台和全媒体智能客服平台,在环信从事智能客服和智能机器人相关工作,致力于用深度学习来提高智能机器人的性能. 写在前面 由于工作太忙,这个系列文章有一年多没有更 ...

  4. 【直观理解】一文搞懂RNN(循环神经网络)基础篇

    推荐阅读时间8min~15min 主要内容简介:神经网络基础.为什么需要RNN.RNN的具体结构.以及RNN应用和一些结论 1神经网络基础 神经网络可以当做是能够拟合任意函数的黑盒子,只要训练数据足够 ...

  5. rnn神经网络模型_一文读懂序列建模(deeplearning.ai)之循环神经网络(RNNs)

    作者:Pulkit Sharma,2019年1月21日 翻译:陈之炎 校对:丁楠雅 本文为你详细介绍序列模型,并分析其在不同的真实场景中的应用. 简介 如何预测一个序列中接下来要发生什么事情是一个非常 ...

  6. rnn按时间展开_一文搞懂RNN(循环神经网络)基础篇

    神经网络基础 神经网络可以当做是能够拟合任意函数的黑盒子,只要训练数据足够,给定特定的x,就能得到希望的y,结构图如下: 将神经网络模型训练好之后,在输入层给定一个x,通过网络之后就能够在输出层得到特 ...

  7. 循环取矩阵的某行_一文搞懂RNN(循环神经网络)基础篇

    神经网络基础 神经网络可以当做是能够拟合任意函数的黑盒子,只要训练数据足够,给定特定的x,就能得到希望的y,结构图如下: 将神经网络模型训练好之后,在输入层给定一个x,通过网络之后就能够在输出层得到特 ...

  8. 一文详解什么是RNN(循环神经网络)

    1.RNN怎么来的? 循环神经网络的应用场景比较多,比如暂时能写论文,写程序,写诗,但是,(总是会有但是的),但是他们现在还不能正常使用,学习出来的东西没有逻辑,所以要想真正让它更有用,路还很远. 这 ...

  9. 什么是RNN?一文看懂强大的循环神经网络(Recurrent Neural Network, RNN)

    循环神经网络(Recurrent Neural Network,RNN)是一类用于处理序列数据的神经网络.所谓序列数据,即前面的输入和后面的输入是有关系的,如一个句子,或者视频帧.就像卷积网络是专门用 ...

最新文章

  1. Codeforces Round #699 (Div. 2) E.Sorting Books(贪心+DP / 线段树)超高质量题解,看不懂来打我 ~
  2. MFC调用批处理文件(.bat)
  3. 工具栏对象GUI Status 与GUI Title
  4. 时间:2014年3月27日文件和目录操作函数
  5. .NET Core 服务在 ARM64 服务器中的部署
  6. 前端学习(3314):redux的基本操作2
  7. IIS 7中ISAPI筛选器配置
  8. antd的select的滚动条怎么才会出现_纵向滚动条对横向滚动条的影响
  9. 献计《权力的游戏》珊莎•斯塔克
  10. click是哪个键 wheel_Click是什么意思?键盘上的Click键在哪里?
  11. 计算机电缆芯数,DJYVP22电缆|电线(直径、重量、芯数)
  12. WIN10版本安装JDK
  13. Android开发基础——RecyclerView
  14. IOS H5页面滑动过于频繁出现短暂白屏
  15. python爬虫实战(2)
  16. 对上海市麦当劳、KFC门店分布进行空间分析
  17. 【SpringBoot】43、SpringBoot中整合RabbitMQ实现延时队列(延时插件篇)
  18. Altium Designer16.0中查找元器件的三种方法
  19. MySQL——数据的操作(增,删,改,查)
  20. 搭档之家|生活中的经济学:边际效用递减

热门文章

  1. {__ob__: observer}取值报错问题
  2. server can;t find yao.com:SERVFAIL的原因
  3. 游戏资讯:预计在10月底至11月内, 版号审批将会恢复
  4. 关于图像显著性(MR)matlab代码详解
  5. 视频H5 video最佳实践
  6. 隐藏控制台程序的dos窗口
  7. STM32CubeMX基于HAL库实现简单串口通信
  8. facebook分享 whatsapp分享 点击按钮复制链接 常用js分享内容
  9. flex布局HTML实例,Flex常见布局实例
  10. Ubuntu重启后nvidia-smi命令报错NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver.