梅宁航 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

学习NLP不用愁了。

算力、环境配置谷歌提供,Colab套件对NLP全场景支持。

有了算力,还差教程,现在NLP学习合集大全套来了。

超强NLP合集

网站名直译过来就是——超强NLP合集!

181个超全资源合集,各个类型全都有,总有一款适合你。

资源概览

资源怎么使用?

光说不练假把式,既然是资源,就是让人用的,满满干货,无套路。

使用资源只需要三步:

1、打开网站,选择、搜索自己感兴趣的内容,比如搜索NLP领域最火的BERT

网站地址见文末

2、可以按描述内容选择自己感兴趣的模型,打开最后一列的Colab链接

得益于谷歌的慷慨,无需担心环境配置,直接进去学习即可。

这里以第一个BERT搜索结果为例????。

Transfer Learning with BERT

3、在进入Colab之后,和本地notebook文件使用方法是一样的,检查好配置之后,就可以按照目录进行学习,实时交互反馈结果。

这也是这份合集的意义,不再是干巴巴的说教,而是图文并茂可运行的实例,练起来!

总有一款模型适合你

当然,BERT只是其中一种类型,如果还没看够,下面是我们梳理的一些分类,可供选用。

1、按所用模型分类,可分为ANN、AxCell、BERT、CNN、GPT-2、LSTM等;

2、按任务类型分类,可分为分类、对话系统、词嵌入、语言模型、机器翻译、问答系统、情感分析等;

3、按所用框架分类,可分为PyTorch、TensorFlow、Keras等。

基本上涵盖了现在NLP发展的全景,不论是框架还是模型、任务,你都能在这里找到适合自己学习的对象。

此外,你也可以为抗击疫情出份力。

COVID-19相关内容

可以BERT来了解疫情期间人们的情绪变化,内容丰富,目录清晰,上手即可操作。

比如说OpenAI刚更新的GPT模型,当然,受限于时间,现在只有GPT-2模型,但了解一下GPT本身也是好的。

GPT-2模型

其中有一位国人作者,15 亿参数 GPT2 中文预训练模型,可以对GPT2本身有直观了解。

并且和谷歌drive一起使用,数据集存放也非常方便,全部流程只需点击两次。

模型本身已经被训练完毕,只需要加载训练使用即可,就这么简单,适合想直接使用的研究。

神奇的小网站

在作者发布之后,Reddit一片感谢贴,毕竟这么简单无套路的资源合集,可以说很良心了。

讨论区图

而且这个搜集资源的小网站也是个好去处,481个数据集,从几M到上G,从CSV格式到JSON格式,应有尽有,可以马克一下作为资源站收藏。

数据集

还有,他们还开发了一款名为RABBIT的文本分类器,可以实时对媒体报道进行分类,帮助我们更好分辨媒体报道的倾向性。

文本分类器RABBIT

妈妈再也不用担心我被“FAKE NEWS”骗了。

⚠️使用教程和下载数据集都要大路畅通哟~

仅仅教程收藏是没用的,一定要自己上手试试哟~

参考链接:
https://www.reddit.com/r/MachineLearning/comments/gvsh51/p_181_nlp_colab_notebooks_found_here/
https://notebooks.quantumstat.com

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

如今高考,得语文者得天下。而语文学习不能一蹴而就,日积月累才是大方向。

这个暑假,全国第一位登上《百家讲坛》的中学语文名师,“线下一课难求”王翔老师首次推出音频课:《经典名句格言90讲》。

90节思维语文音频课
暑期限时折扣89元????

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

181个NLP教程合集,Colab一键直达,无需环境配置,此外还有481个文本数据集相关推荐

  1. 文本分类数据集_181个NLP教程,481个文本数据集,Colab一键直达,无需环境配置...

    学习NLP不用愁了. 算力.环境配置谷歌提供,Colab套件对NLP全场景支持. 有了算力,还差教程,现在NLP学习合集大全套来了. △超强NLP合集 网站名直译过来就是--超强NLP合集! 181个 ...

  2. PaddleHub教程合集

    原文链接:https://aistudio.baidu.com/aistudio/projectdetail/2168053 PaddleHub教程合集 PaddleHub是基于PaddlePaddl ...

  3. Fiddler 和 Wireshark抓包教程合集

    本教程包括: 一:Wireshark专区 [1Wireshark网络分析实践] [2Wireshark视频教程(基础设置)] [3Wireshark协议分析从入门到精通] [4网络数据包分析协议分析 ...

  4. Revit教程合集110部

    Revit教程合集110部 教程说明:英文视频教程,部分有中文字幕,大部分有工程文件 教程格式:Flv.MP4格式,大部分高清,确保能看清软件上的文字 发货方式:百度网盘下载链接(教程较多,可转存到自 ...

  5. ncl如何添加线shp文件_教程合集 | 地图数据找不到?家园都有解决方案!

    原标题:教程合集 | 地图数据找不到?家园都有解决方案! 本栏目为气象家园各类优质教程的合集,每期一个主题. 各位小伙伴在画图的时候是否曾经因为地图问题而头秃呢?第一期将从地图数据部分开始,打好小旗子 ...

  6. 百度百科创建词条教程合集分享,赶紧收藏起来

    每一个企业.品牌.人物.产品想要提升自己的知名度,都要创建一个属于自己的百度百科词条,互联网时代,百度搜索引擎的地位是不可撼动的,每天都有上亿的用户在百度上搜索相关内容,百度百科词条在网络营销中占据着 ...

  7. java开发工具IntelliJ IDEA全面教程合集

    IntelliJ IDEA在业界被公认为优秀的Java开发平台之一,在智能代码助手.代码自动提示.重构.J2EE支持.Ant.JUnit.CVS整合.代码审查. 创新的GUI设计等方面表现突出,并支持 ...

  8. PS 2021最新最全插件滤镜大全一键安装版下载 Photoshop插件合集WIN一键安装版 支持PS 2021

    PS 2021最新最全插件滤镜大全一键安装版下载 Photoshop插件合集WIN一键安装版 支持PS 2021 原文及下载地址:https://www.aeziyuan.com/t-19256.ht ...

  9. 《JavaCV从入门到实战教程合集》介绍和目录

    前言 <JavaCV从入门到实战教程合集>是2016年<JavaCV开发实战教程>和2018年<JavaCV入门教程>2022年<JavaCV音视频实战宝典& ...

最新文章

  1. python每个if条件后面都要使用冒号_每一个条件后面都要使用冒号。(2.0分)_学小易找答案...
  2. 看不到日志_Kubernetes中常用的日志收集方案
  3. 【深度学习】计算机视觉相关技术探索(一)
  4. JS 对象机制深剖——new 运算符
  5. ABAP如何生成UUID
  6. 玩转Numpy——np.ravel()的使用
  7. 全国大学生电子设计大赛 赛前准备
  8. 使用SVN提示“工作副本已经锁定”的解决办法
  9. 2022年百度新能源汽车行业洞察
  10. 远程桌面端口修改批处理
  11. python如何爬取网站所有目录_用python爬虫爬取网站的章节目录及其网址
  12. syn-proxy源码分析(1)
  13. 声波的时域和频域Python实现示例
  14. org.mybatis.caches.ehcache.LoggingEhcache
  15. 米兔机器人魔方_米兔指尖积木?就要盘它
  16. Rust中iter()和into_iter()的区别
  17. Flutter直播间弹幕效果实现
  18. 60mph和kmh换算_mph和kmh换算(mph换算器)
  19. camera驱动电源配置_[ROS] 安装 USB Camera 驱动并调用
  20. 211大学副教授月工资只有7000多?高校教授真实的待遇情况如何?

热门文章

  1. 单行Bash无限while循环的语法
  2. 用jQuery作为JS对象从选项中添加选项的最佳方法是什么?
  3. Data Structure_Sort Algorithm
  4. 掘金Markdown使用
  5. 2017-01-03
  6. unity, 什么时候用静态类,什么时候用单例
  7. Flask驱动的静态站点生成器(译)
  8. 对于访问IIS元数据库失败的解决方案
  9. CISCO PIX/ASA Failover 技术初步学习
  10. XamarinAndroid组件教程设置动画的设置插值器