点击上方“视学算法”,选择加"星标"或“置顶

重磅干货,第一时间送达

转自:机器之心

编辑:杜伟


Hugging Face NLP 课程开课了,所有课程完全免费。

NLP 领域的小伙伴应该都非常熟悉大名鼎鼎的 Hugging Face,这家专注于解决各种 NLP 问题的初创公司为社区带来了很多有益的技术成果。去年,该团队的 Transformers 代码库论文获得了 EMNLP 2020 最佳 demo 奖。今年 4 月,该团队发布了适用于多 GPU、TPU 和混合精度训练的 PyTorch 新库「Accelerate」。

近日,Hugging Face 在其官方推特上宣布推出第一部分 NLP 课程,内容涵盖如何全面系统地使用 Hugging Face 的各类库(即 Transformers、Datasets、Tokenizers 和 Accelerate),以及 Hugging Face Hub 中的各种模型。更重要的是,所有课程完全免费且没有任何广告。

课程主页:https://huggingface.co/course/chapter0?fw=pt

整个系列的课程分为入门(Introduction)、进阶(Diving in)和高级(Advanced),其中具体如下:

  • 入门:Transformer 模型、使用 Transformers、微调预训练模型以及分享模型和 tokenizers;

  • 进阶:Datasets 库、Tokenizers 库、主要 NLP 任务以及如何寻求帮助;

  • 高级:专用架构、加速训练、自定义训练 loop 以及向 Hugging Face 提交贡献。

Hugging Face 本次推出的正是入门课程。通过四个章节的内容讲解,学习者可以学得使用 pipeline 函数来解决文本生成和分类等 NLP 任务、Transformer 架构,以及区分编码器、解码器、编码器 - 解码器架构和用例。

与此同时,Hugging Face 在课程中使用的所有库都可以通过 Python 包获得。学习者首先需要设置 Python 环境和安装专用库,并可以使用 Colab notebook 或 Python 虚拟环境来设置自己的工作环境。具体操作请参阅课程主页中的「setup」部分。

课程概

第 1 章到第 4 章(入门)介绍了 Transformers 库的主要概念。本部分课程结束时,你将熟悉 Transformer 模型的工作原理,并了解如何使用 Hugging Face Hub 中的模型,在数据集上对其进行微调,以及在 Hub 上共享结果。

第 5 章到第 8 章(进阶)介绍了在深入研究经典的 NLP 任务之前,首先介绍了数据集和 Tokenizers 的基础知识。本部分结束时,你将能够自己解决最常见的 NLP 问题。

第 9 章到第 12 章(高级),会进行深入的学习,展示了专业架构(内存效率,长序列等),并教你如何为用例编写自定义对象。在本部分结束时,你将会解决复杂的 NLP 问题。

以下为第 1 章到第 4 章(入门)课程内容:

注意,学习这门课程,你需要掌握以下知识:

  • 需要良好的 Python 知识;

  • 最好是在学习完基础性的深度学习课程之后,比如「Practical Deep Learning for Coders 」或者 deeplearning.ai 的深度学习课程;

  • 不需要提前学习 PyTorch 或 TensorFlow 知识,不过熟悉其中任何一种都会有所帮助。

讲师介绍

Matthew Carrigan 是 Hugging Face 的机器学习工程师,此前曾担任预测分析公司 Parse.ly 的机器学习工程师和都柏林圣三一学院的博士后研究员。

Lysandre Debut 同为 Hugging Face 的机器学习工程师,并且从很早期就开始从事 Transformers 库相关的工作。

Sylvain Gugger 是 Hugging Face 的研究工程师,也是 Transformers 库的核心维护者之一。此前,他曾任非盈利研究组织 fast.ai 的研究科学家,并与 fast.ai 创始人 Jeremy Howard 合著书籍《Deep Learning for Coders with fastai and PyTorch》。他的研究重点在于设计和改进促使模型在有限资源上快速训练的技术,使得深度学习更易获得。

点个在看 paper不断!

Hugging Face官方NLP课程来了!Transformers库维护者之一授课,完全免费相关推荐

  1. Hugging Face官方课程来了!Transformers库维护者之一授课,完全免费

    作者 | 杜伟 来源 | 机器之心 Hugging Face NLP 课程开课了,所有课程完全免费. NLP 领域的小伙伴应该都非常熟悉大名鼎鼎的 Hugging Face,这家专注于解决各种 NLP ...

  2. Hugging Face 的 Transformers 库快速入门 (一)开箱即用的 pipelines

    注:本系列教程仅供学习使用, 由原作者授权, 均转载自小昇的博客 . 文章目录 前言 开箱即用的 pipelines 情感分析 零训练样本分类 文本生成 遮盖词填充 命名实体识别 自动问答 自动摘要 ...

  3. 吴恩达家免费 NLP 课程重磅上线!110 个小视频教你做出聊天机器人,粉丝:我要让娃跟吴恩达姓!...

    郭一璞 发自 凹非寺 量子位 报道 | 公众号 QbitAI 朋友们,又有新课可以白嫖了 昨天晚上,吴恩达宣布DeepLearning.ai的NLP(自然语言处理)课程在Coursera上线了. 目前 ...

  4. 这套1600赞的NLP课程已开放,面向实战,视频代码都有丨资源

    铜灵 发自 凹非寺 量子位 出品 | 公众号 QbitAI 纸上得来终觉浅,决胜NLP要躬行. 一套面向实战.号称"代码优先"的NLP课程来了,名字为A Code-First In ...

  5. 吴恩达家免费NLP课程上线啦!

    郭一璞 发自 凹非寺 量子位 报道 | 公众号 QbitAI 朋友们,又有新课可以白嫖了 就在这几天,吴恩达宣布DeepLearning.ai的NLP(自然语言处理)课程在Coursera上线了. 目 ...

  6. 斯坦福大学2019年NLP课程上线,下周二开课 | 附PPT+视频

    晓查 发自 凹非寺  量子位 出品 | 公众号 QbitAI 斯坦福2019年的深度学习NLP课程开课啦!从1月8日开始,每周二和周四下午,都会有一节长达2小时20分钟的讲座.课程的PPT和视频资源将 ...

  7. 这套GitHub 1300星的NLP课程即将完结,视频授课,在线答疑丨课程

    郭一璞 发自 椰子树下  量子位 报道 | 公众号 QbitAI 最近NLP方向的资源越来越多,GitHub上又出现了一套新的课程,目前已经获得了1300多颗星星. 在这套NLP课程中,作者们把这套课 ...

  8. 西湖大学张岳老师NLP课程笔记1 Introduction

    西湖大学张岳老师NLP课程笔记1 Introduction 参考资料 B站链接 课程主页 <Natural Language Processing: A Machine Learning Per ...

  9. 阿里云官方学习课程推荐-Linux运维学习路线 从事云计算运维相关工作必备技能

    阿里云官方学习课程推荐-Linux运维学习路线 从事云计算运维相关工作必备技能 目前越来越多的企业需要依赖于IT技术发布产品与服务,尤其是电子商务最为明显,它凸显了IT技术在现代企业中的重要性.当企业 ...

最新文章

  1. windows 8 突然不能上网 LSP 二种修复方法
  2. 【数据分析】理解数据分析
  3. 设计模式(九)--注册树模式
  4. jQuery Raty星级评分插件使用方法
  5. Error: Flash Download failed - Target DLL has been cancelled
  6. #1130 - Host 'localhost' is not allowed to connect to this MySQL server
  7. es 时间字段聚合_ES之五:ElasticSearch聚合
  8. 单词翻转(信息学奥赛一本通-T1144)
  9. C#LeetCode刷题之#219-存在重复元素 II​​​​​​​(Contains Duplicate II)
  10. AI 专利之争:小米超华为,国家电网才是大 Boss?
  11. 使用tar进行磁带备份的命令汇总
  12. linux下gcc/g++命令
  13. struts2入门第一天----------一个简单例
  14. 成大事,赚大钱,都要有股永不服输的精神
  15. vi两个文件之间复制
  16. 用户未登录跳转至登录页面
  17. html设置字体为5号,以下HTML代码中,哪一个是将词语“Run Away Bride”显示为Verdana字体并且字号为5号的正确代码?...
  18. 支付中心-重复支付问题解决
  19. 湘鄂情资源独具 大数据转型可期
  20. php关联数组求平均值,用PHP关联数组求笛卡儿积

热门文章

  1. Delphi数据库开发之TTable篇1
  2. 电子学会 软件编程(图形化)二级训练营
  3. 尚育鹏:Leetcode刷题总结(数组)
  4. 刻意练习:LeetCode实战 -- Task15. 有效的括号
  5. 深圳杯---垃圾焚烧厂的经济补偿问题
  6. python launcher怎么使用_QMUI实战(一)—为何我们要使用 LauncherActivity?
  7. 龙蜥降世,神龙升级,阿里云投入 20 亿发力操作系统
  8. CSDN”原力计划“在召唤:技术人请集结,用原创技术影响万千开发者
  9. 阿里云智能 AIoT 首席科学家丁险峰:阿里全面进军IoT这一年 | 问底中国IT技术演进...
  10. 简单明了,一文入门视觉SLAM