郭一璞 发自 椰子树下 
量子位 报道 | 公众号 QbitAI

最近NLP方向的资源越来越多,GitHub上又出现了一套新的课程,目前已经获得了1300多颗星星。

在这套NLP课程中,作者们把这套课程拆分成了13周,从文本嵌入分类开始讲,到Seq2Seq,再到机器翻译、对话系统,内容丰富。

每周的课程除了主要的讲座视频之外,还有研讨会部分,听众可以在研讨会上用英文提问,已经讲完的课程带有视频和Python笔记,另外还有课后作业笔记。

13周的课程

具体的课程时间表如下:

第一周

讲座:介绍文本嵌入、分布式语义、LSA、Word2Vec、GloVe的用法和使用场景。
研讨会:单词和句子嵌入。

第二周

讲座:文本分类。
文本表示的经典方法:BOW,TF-IDF。
神经方法:嵌入,卷积,RNN。
研讨会:卷积神经网络的薪酬预测; 解释网络预测。

第三周

讲座:语言模型,N-gram和神经方法; 可视化训练的模型。
研讨会:使用语言模型生成ArXiv论文。

第四周

讲座:
Seq2seq:编码器 - 解码器框架。
Attention:Bahdanau模型。
研讨会:酒店和宿舍描述的机器翻译。

第五周

讲座:结构化学习,结构化感知器,结构化预测,RL基础知识。
研讨会:POS标签。

第六周

讲座:期望最大化和单词对齐模型。
研讨会:实现期望最大化。

第七周

讲座:机器翻译,回顾PBMT的主要思想,过去3年NMT开发的应用程序特定思想以及该领域的一些开放性问题。
研讨会:学生演讲。

第八周

讲座:网络学习的内容和原因:“模型”永远不仅仅是“模型”!NLP中的多任务学习,如何理解,模型表示包含哪些信息。
研讨会:通过与其他任务共同学习,提高指定实体的认可度

第9~13周

第9~13周的内容作者们还没有更新,根据目录来看,主要是讲域名适应、对话系统、对抗方法和TBA。

作者

这份NLP教程一共有5位作者,其中一作小姐姐Elena Voita是俄罗斯AI公司Yandex的研究员,专供NLP、机器翻译方向,今年还发了一篇关于文本识别和机器翻译的ACL论文。

Elena Voita目前在阿姆斯特丹大学读机器学习、NLP方向的博士,同时还是爱丁堡大学访问博士。

传送门

GitHub:
https://github.com/yandexdataschool/nlp_course

Jupyter:
https://mybinder.org/v2/gh/yandexdataschool/nlp_course/master

年度评选申请

加入社群

量子位AI社群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;

此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。

进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)

活动策划招聘

量子位正在招聘活动策划,将负责不同领域维度的线上线下相关活动策划、执行。欢迎聪明靠谱的小伙伴加入,并希望你能有一些活动策划或运营的相关经验。相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

这套GitHub 1300星的NLP课程即将完结,视频授课,在线答疑丨课程相关推荐

  1. 手机上的机器学习资源!Github标星过万的吴恩达机器学习、深度学习课程笔记,《统计学习方法》代码实现!...

    吴恩达机器学习.深度学习,李航老师<统计学习方法>.CS229数学基础等,可以说是机器学习入门的宝典.本文推荐一个网站"机器学习初学者",把以上资源的笔记.代码实现做成 ...

  2. 新建网站了!Github标星过万的吴恩达机器学习、深度学习课程笔记,《统计学习方法》代码实现,可以在线阅读了!...

    吴恩达机器学习.深度学习,李航老师<统计学习方法>,可以说是机器学习入门的宝典.本文推荐一个网站"机器学习初学者",把以上资源的笔记.代码实现做成了网页版,可以在线阅读 ...

  3. GitHub 5W 星:一行命令下载全网视频的两个开源项目

    大家好,我是你们的 猫哥,那个不喜欢吃鱼.又不喜欢喵 的超级猫 ~ 前言 相信大多数人都有想下载某个网站上的视频的想法. 比如  B站.优酷.YouTube.腾讯视频等网站上的优质视频. 但是大多数视 ...

  4. Github 1300+ 星!旷视开源的深度强化学习绘画智能体论文解读

    借助于强化学习,AI也能画画了.上图为旷视提出的绘画机器人画故宫的过程. 本文中旷视研究院介绍了团队在机器仿人类绘画方面的最新研究,方法在四个大型数据集上表现优异.通过结合深度强化学习方法和神经网络渲 ...

  5. 这个GitHub 1400星的Git魔法书火了,斯坦福校友出品丨有中文版

    杨净 发自 凹非寺  量子位 报道 | 公众号 QbitAI 如何学用Git? 或许这有一本适合你的Git魔法书. 由斯坦福大学CS校友Ben Lynn编写,2007年出品的Git Magic,如今已 ...

  6. Python人工智能基础到实战课程-北方网视频

    ** Python人工智能基础到实战课程 ** 课程主要分为6大模块,带领大家逐步进步人工智能与数据科学领域. 第一阶段:Python语言及其数据领域工具包使用 本阶段旨在帮助大家快速掌握数据领域最常 ...

  7. leetcode 滴滴_拿到腾讯字节快手offer后,他的LeetCode刷题经验GitHub获1300星

    杨净 发自 凹非寺 量子位 报道 | 公众号 QbitAI 今天,你刷LeetCode了吗? 最近,GitHub上这样一套LeetCode笔记火了. 一位Java研发工程师分享了一个名为「LeetCo ...

  8. 上Github,北大、清华、浙大、中科大4大名校课程在线学,加星总数超1.8万

    [导读]因为大学生找课程资料很麻烦,直到有人把搜集到的资料放在了Github上!现在,你不光都可以自由免费的获取北大.清华.浙大.中科大的相关课程资源进行自学,也可以对资源进行补充. 读过大学的人,对 ...

  9. 【NLP】Github标星7.7k+:常见NLP模型的PyTorch代码实现

    推荐github上的一个NLP代码教程:nlp-tutorial,教程中包含常见的NLP模型代码实现(基于Pytorch1.0+),而且教程中的大多数NLP模型都使用少于100行代码. 教程说明 这是 ...

最新文章

  1. Qt Creator管理数据收集设置
  2. U盘文件名称变成乱码的解决方法
  3. 前端学习 -- Css -- 属性选择器
  4. 组合赋权法之python
  5. 对软件测试团队“核心价值”的思考
  6. 不等式解集怎么取_6.初中数学:一个不等式的解集,都是另一个不等式的解,求a的取值范围?...
  7. json转excel_json数据转换成excel表格
  8. 10.3 黑马Vue电商后台管理系统 进一步完善订单模块--修改发货地址
  9. 站在巨人的肩膀上—英语
  10. Android 代码形式安装证书到手机内
  11. ABeam Recruiting | ABeam旗下艾宾信息技术开发(西安) 2023届校招资讯大放送
  12. [SYZOJ279]滑♂稽♂树
  13. SAP CO-PC物料标准价格更改方案
  14. sendgrid html text,使用SendGrid发送电子邮件
  15. linux中常用打开pdf文档指令软件
  16. keil (MDK + C51) 安装
  17. 懂点前端——对CSS中的Padding、Border、Margin属性的理解
  18. 基于Python的马尼拉PC端桌游设计与实现
  19. 磁盘碎片整理的新方法
  20. 【MATLAB编程实战】【例题实战】绘制曲面、曲线,求解偏导,计算极值点,二重积分,曲线积分,收敛性,麦克劳林展开式

热门文章

  1. 如何数分钟创建并成功运行数千台云主机?
  2. 程序员为什么 365 天背电脑包?这答案我服!
  3. 动辄年薪 25 万只是白菜价的人工智能黄了?
  4. 堕落 Java vs 新贵 Python,2018 年最应该学习哪一门编程语言?
  5. 天天 Java、C/C++,可这五种编程语言你知道吗?
  6. 线程同步之 生产者消费者模型详解
  7. nasdocker推荐,附小技巧
  8. git reset --hard HEAD 后恢复暂存区文件
  9. python函数参数列表_python函数列表
  10. pythonpandas重复数据统计_python – 连续的pandas数据帧之间的重复计算