1.文本预处理

记录一哈文本数据的常见预处理步骤:

(1)读入文本

(2)分词

(3)建立字典,将每个词映射到一个唯一的索引(index)

(4)将文本从词的序列转换为索引的序列,方便输入模型

2.基于统计学的语言模型

主要理论是一个n元语法,它是一个基于n-1阶马尔可夫链的概率语言模型,主要解释如下:

3.循环神经网络基础

(1)需要明白循环神经网络的设计目的在于处理时间序列类的数据,例如自然文本语言。其预测输出不仅与当前时刻输入有关,也与历史时刻输入有关,  网络结构如下:

循环神经网络引入一个隐藏变量H,用Ht表示H在时间步t的值。Ht的计算基于Xt和上一时刻状态Ht−1,可以认为Ht记录了到当前字符为止的序列信息,利用Ht对序列的下一个字符进行预测。

(2)裁剪梯度

由此可以解决循环神经网络中梯度爆炸问题。

----------------------家中条件有限,精力不能集中,仓促的笔记,未能亲自敲代码;过两日把老板的ARX预测模型搞通再来详细学习伯禹的网课,感谢伯禹公益AI《动手学》!

伯禹-公益AI学习打卡 Task02相关推荐

  1. 伯禹公益AI《动手学深度学习PyTorch版》Task 07 学习笔记

    伯禹公益AI<动手学深度学习PyTorch版>Task 07 学习笔记 Task 07:优化算法进阶:word2vec:词嵌入进阶 微信昵称:WarmIce 优化算法进阶 emmmm,讲实 ...

  2. 伯禹公益AI《动手学深度学习PyTorch版》Task 03 学习笔记

    伯禹公益AI<动手学深度学习PyTorch版>Task 03 学习笔记 Task 03:过拟合.欠拟合及其解决方案:梯度消失.梯度爆炸:循环神经网络进阶 微信昵称:WarmIce 过拟合. ...

  3. 伯禹公益AI《动手学深度学习PyTorch版》Task 05 学习笔记

    伯禹公益AI<动手学深度学习PyTorch版>Task 05 学习笔记 Task 05:卷积神经网络基础:LeNet:卷积神经网络进阶 微信昵称:WarmIce 昨天打了一天的<大革 ...

  4. 伯禹公益AI《动手学深度学习PyTorch版》Task 06 学习笔记

    伯禹公益AI<动手学深度学习PyTorch版>Task 06 学习笔记 Task 06:批量归一化和残差网络:凸优化:梯度下降 微信昵称:WarmIce 批量归一化和残差网络 BN和Res ...

  5. 伯禹公益AI《动手学深度学习PyTorch版》Task 04 学习笔记

    伯禹公益AI<动手学深度学习PyTorch版>Task 04 学习笔记 Task 04:机器翻译及相关技术:注意力机制与Seq2seq模型:Transformer 微信昵称:WarmIce ...

  6. 1w+大学生在线学习,弘玑Cyclone与伯禹教育开展大学生RPA认证集训营

    近日,弘玑Cyclone与伯禹教育在易班平台上面向全国高校开展2022年第一期"零基础就业班--RPA(机器人流程自动化)认证集训营",为中国高校学生普及RPA知识. Forres ...

  7. 结营答辩!28天!Datawhale助力公益AI一起学,点亮最暖寒假!

    创新公益 28天前,为抵抗疫情,高校学子纷纷驻守在家,不能返校.不能去图书馆.在家如何高效学习,应对科研升学.求职就业的挑战? 我们觉得,大家需要一门好课,也需要好的学习氛围,更需要从学习到实践到就业 ...

  8. 哪本python入门书内容最详细-重磅 | 由浅入深的 AI 学习路线,最详细的资源整理!...

    原标题:重磅 | 由浅入深的 AI 学习路线,最详细的资源整理! [导读] 本文由知名开源平台,AI技术平台以及领域专家: Datawhale, ApacheCN, AI有道和 黄海广博士联合整理贡献 ...

  9. 坚持学习打卡的人,将来会变成什么样?

    坚持打卡的人,将来会变成怎么样?让我们拭目以待.我组织了一个打卡活动,希望大家踊跃参加. 有一个励志故事: 在中国的最东边生长着一种竹子,名叫"毛竹".那里的农民到处播种,每天精心 ...

最新文章

  1. 分享一个MD5加密的工具类
  2. Java多线程(二):Callable和FutureTask结合使用获取返回值
  3. java returnAddres_JavaClient 查询ES-(重要)
  4. jzoj3382-七夕祭【贪心,中位数】
  5. LeetCode MySQL 1661. 每台机器的进程平均运行时间
  6. Spring Cloud源码分析(一)Eureka
  7. 中文版GPT-2,可用于写小说、诗歌、新闻等
  8. 也谈WEB打印(四):让我们的模板支持打印,并根据内容动态的生成页面
  9. mysql uroot p 报错,MySQL链接错误集。
  10. 数学6年级测试软件,苏教版数学六年级下册2018年小学六年级毕业测试试卷(无答案).doc...
  11. 问题解决,心情不错:)
  12. Servlet做Controller,实现一个类处理多个请求
  13. 如何在linux系统下训练tensorflow深度学习模型
  14. Unity3D 学习笔记6 ——协程
  15. ASEMI代理AD823AARZ-RL原装ADI车规级AD823AARZ-RL
  16. 机器视觉设计,如何正确的选择相机和镜头?
  17. Ubuntu 命令行常见指令
  18. HTML+CSS flex弹性布局
  19. web开发之Cookie使用
  20. java常见算法面试题

热门文章

  1. dosbox 自动运行_如何使用DOSBox在新计算机上运行90年代的老旧游戏
  2. 利用深度强化学习训练机械臂环境
  3. 对象存储、文件存储、块存储区别介绍
  4. 离开外包之后,花了10000小时,最后我走进字节跳动拿到了offer
  5. 软件开发必备英语汇总
  6. OKR 年度规划实践:如何在 2022 年做好准备
  7. linux 中 lrwxrwxrwx是什么意思?
  8. 终于进了腾讯,记录一下我作为一名测试员磕磕碰碰的三个月找工作经历...
  9. LINUX NGINX 环境禁止访问指定后缀文件
  10. Android屏幕上涂鸦画笔标记的实现