夏乙 发自 凹非寺
量子位 出品 | 公众号 QbitAI

所谓自然语言处理(NLP),其实涵盖了很多方面。比如有已经无处不在的机器翻译,各大公司总在冲击排行榜的机器问答,也有普通人不太熟悉的情感分析。

在不同的分支领域,往往有着不一样的研究方法和模型,一个机器翻译模型直接拿来搞机器问答,基本上是行不通的。

于是,NLP老牌劲旅Salesforce觉得……这么多任务,真需要一个一个来吗?

于是,他们创造了一个NLP十大全能模型,要用这一个模型,搞定十项NLP任务。

十大任务

Salesforce总结的十大任务,简单来说包括:问答、机器翻译、摘要、自然语言推理、情感分析、语义角色标注、关系抽取、目标导向对话、语义分析、常识代词消解。

这些任务打包在一起还有个名字,叫做自然语言十项全能(Natural Language Decathlon,简称decaNLP)。

他们想通过这个十项全能任务集,带着同行们一起探索能泛化到所有任务的模型,研究这些模型和那些单一任务模型相比有什么不同。

为此,Salesforce给整套任务集提出了一个衡量标准:decaScore,是各任务衡量标准十合一的结果,范围在1-1000之间。

虽说做了个评测标准,但他们没有提供单独的测试集,而是选择用SQuAD平台来测试。

decaNLP对于十大任务有着特殊的处理方式:不管要干什么,都先转化成问答形式再说。

所谓问答形式,包括一个问题,和所需的语境信息(context)。

比如要翻译一句话,就会将原本要翻译的句子作为语境信息,把整个任务转化为一个问题:“这句英语翻译成德语是什么?”

摘要任务,就会转换成以一段话作为语境信息,回答一个“这段话的摘要是什么”的问题。

全能模型

而这个能一己之力搞定十大任务的模型,名叫MQAN,全称是多任务问答网络(Multitask Question Answering Network )。

顾名思义,它本质上是用于问答任务的 ,对于Salesforce这种将一切问题转换成问答的做法,自然也如鱼得水。

MQAN不包含针对特定任务的修改、参数或者模型。它会将输入的问题和语境用BiLSTM编码,用dual coattention来决定每个序列对另一个的呈现方式,然后用另外两个BiLSTM来压缩所有信息,运用self-attention来收集长距离相关性信息,最后再用两个BiLSTM来得出问题和语境的最终呈现。

传送门

关于这十大全能任务和模型,Salesforce的官方博客上都有详细介绍,还给出了相应的论文和代码 

官方介绍(英文):https://einstein.ai/research/the-natural-language-decathlon

论文:https://einstein.ai/static/images/pages/research/decaNLP/decaNLP.pdf

GitHub:https://github.com/salesforce/decaNLP

诚挚招聘

量子位正在招募市场运营实习生,参与线上/线下活动整体流程,帮助制作相关物料,运营社群等。工作地点在北京中关村。

期待有热情的同学加入!简历欢迎投递到quxin@qbitai.com

具体细节,请在量子位公众号(QbitAI)对话界面,回复“实习生”三个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

一个模型搞定十大自然语言任务:NLP全能选手来了 | 论文+代码相关推荐

  1. NLP通用模型诞生?一个模型搞定十大自然语言常见任务

    翻译 | 于之涵 编辑 | Leo 出品 | AI科技大本营 (公众号ID:rgznai100) AI科技大本营按:目前的NLP领域有一个问题:即使是再厉害的算法也只能针对特定的任务,比如适用于机器翻 ...

  2. NLP通用模型decaNLP诞生,一个模型搞定十大自然语言常见任务

    然而近日,Salesforce发布了一项新的研究成果:decaNLP--一个可以同时处理机器翻译.问答.摘要.文本分类.情感分析等十项自然语言任务的通用模型. Salesforce的首席科学家Rich ...

  3. 一个模型搞定多个CTR业务!阿里STAR网络介绍(附代码实现)

    今天为大家带来阿里巴巴2021年的一篇文章:<One Model to Serve All: Star Topology Adaptive Recommender for Multi-Domai ...

  4. Meta AI推出“杂食者”:一个模型搞定图像、视频和3D数据三大分类任务,性能还不输独立模型...

    丰色 发自 凹非寺 量子位 | 公众号 QbitAI 最近,Meta AI推出了这样一个"杂食者" (Omnivore)模型,可以对不同视觉模态的数据进行分类,包括图像.视频和3D ...

  5. AI版「女娲」来了!文字生成图像、视频,8类任务一个模型搞定

    来源丨机器之心 作者丨陈萍.小舟 AI会是未来的「造物者」吗? 近来,视觉合成任务备受关注.几天前英伟达的 GauGAN 刚刚上新了 2.0 版本,现在一个新视觉合成模型 Nüwa(女娲)也火了. 相 ...

  6. 一个模型搞定图像标注、读图问答两件事,VQA准确率逼近人类水平 | Demo可玩...

    明敏 发自 凹非寺 量子位 | 公众号 QbitAI 现在,丢给AI一张图,它不仅能看图说话,还能应对人们提出的刁钻问题了. 比如,给它看一张经典卷福照. 它便能回答出: 一个穿着西服.正在比划手势的 ...

  7. python利器app怎么查文献-科研人必备:一个工具搞定文献查阅、数据分析、模型搭建...

    原标题:科研人必备:一个工具搞定文献查阅.数据分析.模型搭建 写论文有多难?这首诗形容得好: 进入学校先选题,踌躇满志万人敌:发现前辈都做过,满脸懵逼加惊奇. 终于找到大空白,我真是个小天才:左试右试 ...

  8. 通用人工智能最新突破!一个Transformer搞定一切

    Datawhale干货 编辑:梦晨 鱼羊,来源:量子位 通用人工智能,还得看DeepMind. 这回,只一个模型,使用相同的权重,不仅把看家本领雅达利游戏玩得飞起. 和人类聊聊天.看图写话也不在话下. ...

  9. 一个系列搞定校招——简历篇

    上一篇一个系列搞定校招--综合篇总体介绍了校招从简历到面试的各个环节,没看过的可以先看上一篇,接下来将分别从每一个环节详细介绍,本篇先说[简历篇]. 前面说过,简历是求职的敲门砖,一份好的简历必然会给 ...

最新文章

  1. Java第一个程序(CMD环境)
  2. php中的单引号、双引号和转义字符
  3. Oracle原理:11g的体系结构
  4. 数据结构:(翻转二叉树) 若二叉树采用二叉链表作存储结构,要交换其所有分支结点的左右子树的位置,采用()遍历方法最合适
  5. mac 重置mysql root密码_MAC重置MySQL root 密码
  6. pandas.Series.quantile
  7. html如何调整打印区域,怎么调整excel打印区域_教你调整excel打印区域的方法-系统城...
  8. java json序列化日期类型
  9. 苹果手机怎样双开微信?简单2步快速安装苹果版双开助手!
  10. net start mongodb 发生系统错误 1058。
  11. office服务器草稿位置,精确定位图片在Word文档中的位置的操作方法
  12. compass项目配置文件config.rb
  13. 容器编排的作用和要实现的内容
  14. 如何用zbrush雕刻布料和褶皱
  15. 储罐液位开关c语言编程,危化品企业罐区液位计和紧急切断阀的设置及联锁要求规范合集(1)...
  16. Android缓冲进度条或加载进度条
  17. MVNO忽略国内漫游(ignore national roaming)
  18. 计算机系统:基本知识
  19. wpsppt插入html,WPS的做好的一个PPT 怎么插入到另一个PPT?
  20. pythonocc的BRepPrimAPI在OCC.Core.BRepPrimAPI里

热门文章

  1. 用 Python 爬了 10 万个产品经理的信息:KPI 多高,锅就有多大!
  2. java 中webservice
  3. 布谷鸟哈希函数的参数_系统学习hash算法(哈希算法)
  4. ios charts显示固定个数_上次挂在了百度iOS二面不服气, 三月之期已到,这次终于拿下offer!...
  5. 接口 vs 类型别名
  6. python调用r语言加载包错误_Python中调用R语言包指南.docx
  7. signature=2d36ad490c0d9e19a6dc808d43a34033,Matemàtica discreta : problemes resolts
  8. android如何开发ui服务,Android UI-对Activity工作流程的理解(一)
  9. python建模 决策_决策树python建模中的坑 :ValueError: Expected 2D array, got 1D array instead:...
  10. springboot testcontext @sql_举世闻名的 SQL 注入是什么?这个漫画告诉你!