伯禹-公益AI学习打卡 Task02
1.文本预处理
记录一哈文本数据的常见预处理步骤:
(1)读入文本
(2)分词
(3)建立字典,将每个词映射到一个唯一的索引(index)
(4)将文本从词的序列转换为索引的序列,方便输入模型
2.基于统计学的语言模型
主要理论是一个n元语法,它是一个基于n-1阶马尔可夫链的概率语言模型,主要解释如下:
3.循环神经网络基础
(1)需要明白循环神经网络的设计目的在于处理时间序列类的数据,例如自然文本语言。其预测输出不仅与当前时刻输入有关,也与历史时刻输入有关, 网络结构如下:
循环神经网络引入一个隐藏变量H,用Ht表示H在时间步t的值。Ht的计算基于Xt和上一时刻状态Ht−1,可以认为Ht记录了到当前字符为止的序列信息,利用Ht对序列的下一个字符进行预测。
(2)裁剪梯度
由此可以解决循环神经网络中梯度爆炸问题。
----------------------家中条件有限,精力不能集中,仓促的笔记,未能亲自敲代码;过两日把老板的ARX预测模型搞通再来详细学习伯禹的网课,感谢伯禹公益AI《动手学》!
伯禹-公益AI学习打卡 Task02相关推荐
- 伯禹公益AI《动手学深度学习PyTorch版》Task 07 学习笔记
伯禹公益AI<动手学深度学习PyTorch版>Task 07 学习笔记 Task 07:优化算法进阶:word2vec:词嵌入进阶 微信昵称:WarmIce 优化算法进阶 emmmm,讲实 ...
- 伯禹公益AI《动手学深度学习PyTorch版》Task 03 学习笔记
伯禹公益AI<动手学深度学习PyTorch版>Task 03 学习笔记 Task 03:过拟合.欠拟合及其解决方案:梯度消失.梯度爆炸:循环神经网络进阶 微信昵称:WarmIce 过拟合. ...
- 伯禹公益AI《动手学深度学习PyTorch版》Task 05 学习笔记
伯禹公益AI<动手学深度学习PyTorch版>Task 05 学习笔记 Task 05:卷积神经网络基础:LeNet:卷积神经网络进阶 微信昵称:WarmIce 昨天打了一天的<大革 ...
- 伯禹公益AI《动手学深度学习PyTorch版》Task 06 学习笔记
伯禹公益AI<动手学深度学习PyTorch版>Task 06 学习笔记 Task 06:批量归一化和残差网络:凸优化:梯度下降 微信昵称:WarmIce 批量归一化和残差网络 BN和Res ...
- 伯禹公益AI《动手学深度学习PyTorch版》Task 04 学习笔记
伯禹公益AI<动手学深度学习PyTorch版>Task 04 学习笔记 Task 04:机器翻译及相关技术:注意力机制与Seq2seq模型:Transformer 微信昵称:WarmIce ...
- 1w+大学生在线学习,弘玑Cyclone与伯禹教育开展大学生RPA认证集训营
近日,弘玑Cyclone与伯禹教育在易班平台上面向全国高校开展2022年第一期"零基础就业班--RPA(机器人流程自动化)认证集训营",为中国高校学生普及RPA知识. Forres ...
- 结营答辩!28天!Datawhale助力公益AI一起学,点亮最暖寒假!
创新公益 28天前,为抵抗疫情,高校学子纷纷驻守在家,不能返校.不能去图书馆.在家如何高效学习,应对科研升学.求职就业的挑战? 我们觉得,大家需要一门好课,也需要好的学习氛围,更需要从学习到实践到就业 ...
- 哪本python入门书内容最详细-重磅 | 由浅入深的 AI 学习路线,最详细的资源整理!...
原标题:重磅 | 由浅入深的 AI 学习路线,最详细的资源整理! [导读] 本文由知名开源平台,AI技术平台以及领域专家: Datawhale, ApacheCN, AI有道和 黄海广博士联合整理贡献 ...
- 坚持学习打卡的人,将来会变成什么样?
坚持打卡的人,将来会变成怎么样?让我们拭目以待.我组织了一个打卡活动,希望大家踊跃参加. 有一个励志故事: 在中国的最东边生长着一种竹子,名叫"毛竹".那里的农民到处播种,每天精心 ...
最新文章
- 分享一个MD5加密的工具类
- Java多线程(二):Callable和FutureTask结合使用获取返回值
- java returnAddres_JavaClient 查询ES-(重要)
- jzoj3382-七夕祭【贪心,中位数】
- LeetCode MySQL 1661. 每台机器的进程平均运行时间
- Spring Cloud源码分析(一)Eureka
- 中文版GPT-2,可用于写小说、诗歌、新闻等
- 也谈WEB打印(四):让我们的模板支持打印,并根据内容动态的生成页面
- mysql uroot p 报错,MySQL链接错误集。
- 数学6年级测试软件,苏教版数学六年级下册2018年小学六年级毕业测试试卷(无答案).doc...
- 问题解决,心情不错:)
- Servlet做Controller,实现一个类处理多个请求
- 如何在linux系统下训练tensorflow深度学习模型
- Unity3D 学习笔记6 ——协程
- ASEMI代理AD823AARZ-RL原装ADI车规级AD823AARZ-RL
- 机器视觉设计,如何正确的选择相机和镜头?
- Ubuntu 命令行常见指令
- HTML+CSS flex弹性布局
- web开发之Cookie使用
- java常见算法面试题