上次写了一篇如何利用百度AI Studio免费GPU资源来研究各种深度学习算法的文章,但有读者反馈说还不够深入,希望每个研究方向都出一个详细的介绍,了解更多并用学到的知识去实战。这篇文章以NLP为主题,通过公开课、项目热榜、应用实践和比赛资讯四个方面带读者实现NLP从入门到获奖。

百度AI Studio有专门的NLP专题网站:

https://aistudio.baidu.com/aistudio/nlp?_=1571383513589

这篇文章将带读者走进NLP的世界,结合自己的学习过程,给读者介绍从入门到获奖的道路。

线上大神讲课,不容错过

AI Studio的NLP专区网站目前公布了三门免费公开课,这里介绍一下

  • 《中文自然语言处理知识入门与应用》百度自然语言处理部主任架构师 孙珂

  • 《篇章分析》百度自然语言处理部主任架构师 肖欣延

  • 《中文NLP预训练模型ERNIE》 百度自然语言处理部资深研发工程师 龚建

以上三个公开课都是百度的工程师大牛讲课,内容干货满满。由于页面篇幅原因,NLP专题页面的公开课只放了上面三个公开课。感兴趣的可以在AI Studio课程板块:

https://aistudio.baidu.com/aistudio/course

寻找更多公开课。

研究应用实践,走近工业

本栏目会更贴近工业实践,让读者能更了解各种深度学习模型在工业上是如何使用的。

  • 分类任务:如何在客服对话中,识别客户情绪的好坏

https://aistudio.baidu.com/aistudio/projectdetail/121630

作者:资深NLP布道师 陈炳金

有的智能音箱、智能车载可以识别用户的情绪,可以适当地进行情绪安抚。这样可以改善产品的用户交互体验。在智能客服场景中,为了分析客服服务质量、降低人工质检成本,我们也需要识别客户情绪,这能够帮助企业更好地把握对话质量、提高用户满意度。作者在示例首先介绍了模型评估指标,然后讲解了CNN的一些知识,最后用TextCNN来实现一个识别客户情绪的模型。

  • 匹配任务:如何根据用户的搜索语句,为用户推荐相似问题

https://aistudio.baidu.com/aistudio/projectdetail/125034

作者:资深NLP布道师 李臻

在问答类社区场景中,如何根据用户的问题推荐更多其感兴趣的相关内容?本节课程将基于此场景出发,讲解NLP的语义相似度匹配的任务,本案例介绍NLP最基本的任务类型之一——文本相似度匹配,Pairwise、Pointwise两种训练模式,来计算两个文本的相似程度。

  • 如何从快递单中抽取关键信息

https://aistudio.baidu.com/aistudio/projectDetail/131360

作者:资深NLP布道师 梁一川

在以前的快递表单信息填写产品流程中,用户需要识别表单概念再进行摘取对应关键信息填写,例如省、市、街道,都要一项项填。而大家现在在填快递地址时,会有粘贴地址就自动给你填上省市街道的体验吧?这就是NLP的效果之一。NLP序列化标注任务将允许用户直接输入个人自然表述,然后机器自动识别关键信息传入后台表单中。本项目将演示如何从用户提供的快递单中,抽取姓名、电话、省、市、区、详细地址等内容,形成结构化信息。这可以辅助物流行业从业者进行有效信息的提取,从而降低客户填单的成本。

  • 语言的中外翻译,你应该知道的NLP生成任务 

项目地址:

https://aistudio.baidu.com/aistudio/projectdetail/120044

作者:资深NLP布道师 毕天驰

翻译是一个非常成熟的NLP生成任务的典型场景。但在成熟的产品背后,离不开不断提升和完善的NLP算法。常规的机器翻译方法有统计机器翻译和神经机器翻译,这里我们主要讨论神经机器翻译。本课将通过动手实践做一个简单的神经翻译程序。

看看项目热榜,巩固学习

NLP专题网站目前推荐了6个fork数比较高的项目,这里简单介绍下:

  • 深度学习入门NLP-文本分类 

本项目数据的来源是从网站上爬取的56821条数据中文新闻摘要, 包含了国际、文化、娱乐、体育、财经、汽车、教育、科技、房产、证券10种类别。项目利用CNN模型,实现根据文章摘要,自动给新闻分类。

项目地址:

https://aistudio.baidu.com/aistudio/projectdetail/78959

  • 循环神经网络NLP-情感分类

IMDB是一个包含了来自互联网的50000条严重两极分化的评论的数据集。本项目采用IMDB数据集,利用LSTM模型,实现了一个对评论的情感进行分类的模型。

项目地址:

https://aistudio.baidu.com/aistudio/projectdetail/78968

  • PaddleHub 情感分析教程 

本示例展示如何使用PaddleHub Senta Module进行预测。Senta是百度NLP开放的中文情感分析模型,可以用于进行中文句子的情感分析,输出结果为正向/中性/负向中的一个,关于模型的结构细节,请查看Senta,(https://github.com/baidu/senta) 本示例代码选择的是Senta-BiLSTM模型。

项目地址:

https://aistudio.baidu.com/aistudio/projectdetail/79398

  • 深度学习进阶NLP-机器翻译

机器翻译即用计算机实现从源语言到目标语言转换的过程,是自然语言处理的重要研究领域之一。本项目采用WMT-14数据集,建立了一个encoder和一个decoder,实现了机器翻译的简单算法,利用代码说明了RNN在机器翻译中的重要作用。

项目地址:

https://aistudio.baidu.com/aistudio/projectdetail/78973

  • ERNIE情感分类实验 

ERNIE是百度的自研模型, 通过建模海量数据中的词、实体及实体关系,学习真实世界的语义知识。相较于BERT学习原始语言信号,ERNIE直接对先验语义知识单元进行建模,增强了模型语义表示能力,以Transformer为网络基本组件,以Masked Bi-Language Model和Next Sentence Prediction为训练目标,通过预训练得到通用语义表示,再结合简单的输出层,应用到下游的 NLP 任务。本示例展示利用ERNIE进行文本分类任务。

项目地址:

https://aistudio.baidu.com/aistudio/projectdetail/90231

  • 基于THUCNews数据集的文本分类 

THUCNews是清华大学根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本项目利用LSTM模型,利用THUCNews作为输入,训练一个能识别新闻类别的模型,例如预测某个新闻是属于游戏、财经还是时政等等。

项目地址:

https://aistudio.baidu.com/aistudio/projectdetail/85638

热榜篇幅有限,未能穷尽百度AI Studio社区里的所有优秀项目,更多的项目可以点击

https://aistudio.baidu.com/aistudio/projectoverview/public/1

关注比赛资讯,赢取奖金

目前NLP专题网站上有三个关于NLP的比赛,分别是

飞桨常规赛: 机器阅读理解

https://aistudio.baidu.com/aistudio/competition/detail/4

飞桨常规赛:知识驱动对话

https://aistudio.baidu.com/aistudio/competition/detail/3

飞桨常规赛: 问答摘要与推理

https://aistudio.baidu.com/aistudio/competition/detail/14

参与人数还没很多,现在参与能赢取奖金的几率很高,快去报名参加吧。

在线参加活动,获得礼物

百度AI Studio将从即日起到10月31日举行免费学AI送礼品的活动,在这期间完成:

  • 完成上述任意项目的Fork

  • 在AI Studio上新建自然语言处理相关并公开项目(注:不可直接fork公开或直接复制粘贴内容)

即可获得百度精美礼品一份,奖品包括百度智能音箱、定制移动电源、定制数据线、GPU算力卡(含100小时免费算力)等,不容错过。

详细参与方式和规则参考链接:

https://ai.baidu.com/forum/topic/show/956441

最后,告诉大家一个好消息,AI Studio持续送算力,十月份深度学习开放月的活动,每天登陆送 24 小时算力。即便没有活动,一天也能送12小时,学习开发绰绰有余,大家赶紧过来薅羊毛啊!

点击文末阅读原文,马上申请免费算力!

大神带你实现 NLP 从入门到获奖,还有免费算力可以薅相关推荐

  1. 王者荣耀10连胜,竟然也有人不相信,猎游大神带菜鸡玩家10连胜

    如果一局游戏一个人头都没有获得,甚至还送了几个人头,这一局游戏大家知道是胜利还是惨败?很多玩家都知道遇到这样的情况,这一局游戏基本上没有戏了,那就是根本不可能有太大的可能再获得胜利,特别是前期敌人顺风 ...

  2. 大神带飞————动态生成对象并绑定父对象(绑定对象池中的对象使自己成为对象池中对象的子对象)

    实例代码 using System.Collections; using System.Collections.Generic; using UnityEngine; public class New ...

  3. SQL优化大神带你写有趣的SQL(6) SELF JOIN的应用

    大家好,我是知数堂SQL 优化班老师 网名:骑龟的兔子 今天给大家,带来的是 SELF JOIN的应用 下面是,表结构和,INSERT 语句脚本. create table t0718 (idx in ...

  4. 大神带你轻松入门次世代游戏建模

    很多人都想要进入游戏这个行业,学习建模是不可避免的.建模可以说是一个进入行业的敲门砖,学会建模才能立足于行业,当然光会建模在公司同样也是无法生存的.对于初学者而言,如何快速入门呢? 学习的方法多种多样 ...

  5. 老猪带你玩转自定义控件三——sai大神带我实现ios 8 时间滚轮控件

    ios 8 的时间滚轮控件实现了扁平化,带来很好用户体验,android没有现成控件,小弟不才,数学与算法知识不过关,顾十分苦恼,幸好在github上找到sai大神实现代码,甚为欣喜,顾把学习这个控件 ...

  6. 【AI好书】KK大神带你俯瞰未来20-30年的科技发展趋势,早阅读一天就让你在互联网时代先行一步!...

    欢迎大家来到<AI 好书>专栏,这一个专栏是面向所有对人工智能技术感兴趣的朋友.在这个专栏里,我们会给大家推荐人工智能相关的优质书籍. 今天要推荐的书籍是<必然--阐述12种必然的科 ...

  7. 求大神带我研究MX模式邮件发送

    本人了解邮件已经几个月了,因为没有接触过学习过这个行业,想找一个师傅有偿学习.有兴趣的大神可以联系我!深谢!

  8. 2017年------阿里大神带你详解Dubbo架构设计

    一.Dubbo的设计角色 (1)系统角色 Provider: 暴露服务的服务提供方. Consumer: 调用远程服务的服务消费方. Registry: 服务注册与发现的注册中心.1 Monitor: ...

  9. c++new时赋初值_C高级编程精髓之内存管理,万千码农踩过的雷,大神带你走出雷区...

    今天给大家分享C高级编程精华片之内存管理--欢迎跟大家一起踏进内存这片雷区,然后带大家从雷区中走出来! 程序员们经常编写内存管理程序,往往提心吊胆.如果不想触雷,唯一的解决办法就是发现所有潜伏的地雷并 ...

  10. 成本管控难题怎么破?BI大神带你一步步拆解分析,节省成本390万

    注:本文为2021帆软BI可视化夏季挑战赛参赛作品,未经授权禁止转载. 今天给大家分享一个优质的BI可视化分析案例--<全面项目利润分析,以激励倒逼成本管控>,这份作品来自于团队" ...

最新文章

  1. BCH区块链上的预言机项目——Oracles
  2. 第十七届全国大学智能车竞赛:第二波芯片申请向你袭来
  3. 如何在aspx.cs 里面获取html 控件值
  4. mac 下 通过 brew 安装 MariaDB
  5. 下坠的小鸟(flappy bird)速算版
  6. postman和部署在 SAP 云平台上的SAP UI5应用发送同样的HTTP请求,为何前者成功,后者失败?
  7. Google Drive客户端
  8. 谷歌浏览器如何如何禁用弹出窗口阻止程序
  9. python3.7.4怎么运行_记一次win7在python3.7.4环境启动ride报错解决
  10. python中特殊变量-python list每三个分成一组python中星号变量的几种特殊用法
  11. MySQL读取配置文件的顺序、启动方式、启动原理
  12. CT一般扫描参数_最实用GE 64排 CT扫描技术请保存、收藏
  13. Spring的事务传播机制
  14. 网红框架FastAPI能否补足python饱受诟病的速度
  15. 关于提升短信ROI,我的6点思考
  16. Android 手写和笔锋研究资料
  17. HDU-1548 A strange lift
  18. 数据防泄密·工控安全保障方案
  19. 什么是CDN,CDN有什么作用?
  20. android 自动发彩信,Android编程实现定时发短信功能示例

热门文章

  1. 【win10.win7】在win10系统里面安装win7系统(亲测有效,方便快捷,无需自己设置开机启动项)
  2. Proteus:51仿真入门
  3. 新手小白之学习python一飞冲天日志之—基本数据类型,条件控制语句
  4. HTML网页随笔笔记
  5. 不使用setCustomView,设置ActionBar标题居中
  6. python 条件判断和循环
  7. C#OOP之十一 委托和事件
  8. 【C++实现python字符串函数库】strip、lstrip、rstrip方法
  9. c#初学者记录(1)
  10. SQL中LIMIT子句介绍