注:这个是笔者用于期末复习的一个简单笔记,因此难以做到全面详细,有疑问欢迎大家在评论区讨论

I. Basic Idea

首先引入一个例子,槽填充(Slot Filling)问题:

  • Input: I would like to arrive Guangzhou on November 2nd.
  • Output: Destination=> Taipei | time of arrival=> November 2nd

即需要在输入句子中提取出我们想了解的给定类型信息(例如上面有两类,目的地与到达时间)。那么对于这个问题,我们可以将其当做一个分类问题来求解,预测每个单词是否属于目的类别中的一个。

而在深度网络只能接受向量(矩阵)作为输入,因此首先需要将单词给映射成向量,这一过程称为word embedding,常见的embedding方法有独热编码法、词哈希法等。

问题:网络需要上下文信息以对词进行准确分类,例如:

  • arrive Guangzhou on November 2nd
  • leave Guangzhou on November 2nd

这两句话中的广州都是地点。然而,如果不看到网络之前的arrive或者leave,我们是无法区分广州到底是指出发地还是目的地,即网络需要内存(memory)。

II. RNN

循环神经网络(Recurrent Neural Network)是一种带记忆的神经网络,这里的记忆存的是网络的隐藏层输出:

下面给出一种更喜闻乐见的RNN画法:

即,上一层隐藏层的内容(a1)会被存储起来,作为一种输入给输进下一层隐藏层(a2)中。回到上面的例子,arrive(x1)经处理后得到的信息(a1)会被输入Guangzhou(x2)编码得到的信息(a2)中,从而影响对Guangzhou内容类别的判定。

此外,RNN也有许多变种,例如将上一层输出(而非上一层隐藏层)输入下一层隐藏层:

或者双向的RNN:

III. LSTM

LSTM(Long Short-term Memory,长短期记忆网络)也是RNN的一种,相比RNN而言其"memory"会更复杂一些,如下所示:

红框里的这一坨相当于之前RNN里我们讲的a1,只不过a1只有简单的存储与传递功能,而这里的LSTM模块功能与结构上都要更为复杂。如果用更加喜闻乐见的形式的话,LSTM长这样:
这个结构…其实挺复杂的,倒也不要求去背,用的时候直接调包即可。

关于LSTM,我们还需要了解其一个性质,即其可以预防梯度消失问题(不能预防梯度爆炸),通过其memory与输入相加。

2021李宏毅机器学习课程笔记——Recurrent Neural Network相关推荐

  1. 李宏毅机器学习作业4——Recurrent Neural Network

    本作业来源于李宏毅机器学习作业说明,详情可看

  2. 2021李宏毅机器学习课程笔记——Auto Encoder

    注:这个是笔者用于期末复习的一个简单笔记,因此难以做到全面详细,有疑问欢迎大家在评论区讨论 https://speech.ee.ntu.edu.tw/~hylee/ml/ml2021-course-d ...

  3. 2021李宏毅机器学习课程笔记——Explainable AI

    注:这个是笔者用于期末复习的一个简单笔记,因此难以做到全面详细,有疑问欢迎大家在评论区讨论 https://speech.ee.ntu.edu.tw/~hylee/ml/ml2021-course-d ...

  4. 2021李宏毅机器学习课程笔记——Adversarial Attack

    注:这个是笔者用于期末复习的一个简单笔记,因此难以做到全面详细,有疑问欢迎大家在评论区讨论 https://speech.ee.ntu.edu.tw/~hylee/ml/ml2021-course-d ...

  5. 2021李宏毅机器学习课程笔记——Domain Adaptation

    注:这个是笔者用于期末复习的一个简单笔记,因此难以做到全面详细,有疑问欢迎大家在评论区讨论 https://speech.ee.ntu.edu.tw/~hylee/ml/ml2021-course-d ...

  6. 【深度学习】李宏毅2021/2022春深度学习课程笔记 - Convolutional Neural NetWork(CNN)

    文章目录 一.图片分类问题 二.观察图片分类问题的特性 2.1 观察1 2.2 简化1:卷积 2.3 观察2 2.4 简化2:共享参数 - 卷积核 2.5 观察3 2.6 简化3:池化 2.6.1 M ...

  7. 【李宏毅机器学习课程笔记】深度强化学习(五)—— Sparse Reward

    文章目录 Introduction Reward Shaping Curiosity Curriculum Learning Hierarchical Reinforcement Learning I ...

  8. 【李宏毅机器学习】Recurrent Neural Network Part1 循环神经网络(p20) 学习笔记

    李宏毅机器学习学习笔记汇总 课程链接 文章目录 Example Application Slot Filling 把词用向量来表示的方法 1-of-N encoding / one-hot Beyon ...

  9. 【李宏毅机器学习笔记】 23、循环神经网络(Recurrent Neural Network,RNN)

    [李宏毅机器学习笔记]1.回归问题(Regression) [李宏毅机器学习笔记]2.error产生自哪里? [李宏毅机器学习笔记]3.gradient descent [李宏毅机器学习笔记]4.Cl ...

最新文章

  1. input python_python input 详解
  2. LeetCode Algorithm 129. 求根节点到叶节点数字之和
  3. 计算机与人脑的异同作文,小学信息技术3-6年级全册教案.pdf
  4. Ubuntu12中samba环境搭建与使用
  5. storm基础系列之二----zookeeper的作用
  6. Sightseeing Cows(POJ-3621)
  7. shell 自动回车_macos开机自动屏蔽独显
  8. JS学习--Number对象
  9. Linux 禁止和开启 ping 的方法
  10. 史上最全面的JTAG和SWD接口的定义/STM32/STM8工程师的福音/JTAG转SWD接口仿真/告别杂乱的仿真线/终于讲清楚了JTAG/SWD
  11. 条件随机场Conditional Random Field,CRF、隐马尔可夫模型Hidden Markov Model,HMM、马尔可夫随机场、马尔可夫性质傻傻分不清楚?帮你理理关系
  12. 简单计算机电脑病毒实验,简单的电脑病毒程序
  13. android计算器如何保存记录,计算器历史记录怎么看
  14. 为什么函数极值点的导数为零
  15. 星星城堡童装加盟雾非雾
  16. 物联网风口,四大科技巨头争相布局,创业公司还有哪些机会?
  17. ASP.NET(C#)图片加文字、图片水印
  18. 2021年中国石墨烯产业链发展分析:节能环保政策的扶持下,石墨烯产业规模将持续扩大[图]
  19. vm15 安装 centos7 详细过程
  20. LCD显示器参数详解

热门文章

  1. .svc接口客户端调用_K8s:调用Java接口创建容器
  2. php 百度报表工具下载,PHP Report Maker12最新版
  3. python作用域(scope)(三分钟读懂)
  4. python 字符串的(乘法和in)(一分钟读懂)
  5. php中connect,PHP中的ftp_connect()函数
  6. android app打开流程_app开发模式的应用
  7. springboot后台怎么获取前端传过来的excel_基于SpringBoot的全自动办公系统源码文档全部免费分享...
  8. 力扣 双周赛补题 2086. 从房屋收集雨水需要的最少水桶数
  9. 洛谷P1087 FBI树
  10. 软件工程导论 06章详细设计