晓查 发自 凹非寺
量子位 出品 | 公众号 QbitAI

NLP领域今年的竞争真可谓激烈。短短一个多月的时间,BERT又重新杀回GLUE测试排行榜第一名。

今年6月,谷歌和CMU提出的NLP模型XLNet在20多项测试中排行第一,性能全面超越BERT。

然而就在XLNet“霸榜”一个月后,Facebook把BERT改进了一番,进一步“榨干”了BERT的性能,帮助它在GLUE和RACE测试中再次取得最优成绩,算是扳回一城。

这个改进版的BERT叫做RoBERTa,全名是Robustly Optimized BERT approach

Facebook不仅发布了文章,还迅速开源了预训练模型。在高于PyTorch 1.1版本中,你甚至可以使用官方的torch.hub直接导入模型。

import torchroberta = torch.hub.load(‘pytorch/fairseq’, ‘roberta.large’)roberta.eval() # disable dropout (or leave in train mode to finetune)

测试得分

RoBERTa在9个GLUE中的4个基准任务测试实现了最先进的结果,总分数为88.5,与XLNet相同的整体GLUE任务性能,双方互有胜负。

在RACE测试中,RoBERTa已经全面超越XLNet。

与BERT的差别

Facebook的研究人员发现超参数选择对BERT的最终结果有重大影响,因此他们重新研究了BERT的预训练模型,测量了不同超参数和训练集大小的影响,结果发现BERT存在明显的训练不足。

经过调整后,BERT可以达到或超过其后发布的每个模型的性能,这些结果突出了之前被忽视的设计选择的重要性,

RoBERTa与BERT的不同之处在于,它依赖于预训练大量数据和改变训练数据的mask模式,而且RoBERTa删除了下一句预测(NSP)。

RoBERTa的修改很简单,包括:

  1. 更长时间的训练时间,更大的batch,更多的数据;

  2. 删除下一句预测(NSP)目标;

  3. 在较长序列上进行训练;

  4. 动态改变用于训练数据的mask模式。

RoBERTa的预训练时间要比BERT长得多,Facebook将预训练步数从100K增加到300K再增加到500K。当步数达到300K时,其性能已经超过了XLNet。

除了在模型上的调整,RoBERTa的训练数据集也比BERT大很多。

原始的BERT使用了13GB大小的数据集,内容来自英文维基百科和BookCorpus。但RoBERTa使用了包含6300万条英文新闻的160GB数据集。

最后,RoBERTa和BERT一样烧钱,研究人员使用1024Nvidia V100 GPU训练了大约一天时间。而BERT需要使用1024个谷歌TPU训练76分钟。

论文地址:
https://arxiv.org/abs/1907.11692

GitHub:
https://github.com/pytorch/fairseq/tree/master/examples/roberta

—  —

加入社群 | 与优秀的人交流

小程序 | 全类别AI学习教程

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 !

BERT重夺多项测试第一名,改进之后性能追上XLNet,现已开源预训练模型相关推荐

  1. 比亚迪在连遭挫败之后,4月份迎来喜报,夺下热销榜第一名

    4月份国内的热销新能源汽车榜单显示,比亚迪秦EV以5096辆的销量位居第一名,这是它在连遭挫败之后终于见到曙光.比亚迪在国产新能源汽车的领头羊,它连续多年在国内新能源汽车市场位居第一名. 在中国推出新 ...

  2. 华为诺亚方舟开源预训练模型“哪吒”,4项任务均达到SOTA

    出品 | AI科技大本营(ID:rgznai100) BERT之后,新的预训练语言模型XLnet.RoBERTa.ERNIE不断推出,这次,华为诺亚方舟实验室开源了基于BERT的中文预训练语言模型NE ...

  3. Bert,Albert,Roberta,XLNet的中英文预训练模型下载网址及教程

    自然语言处理的各大热门的中英文预训练模型下载网址,包含了Bert,Albert, Roberta, XLNet等模型的base和large.tensorflow和pytorch版本的预训练模型. ht ...

  4. 句法依存分析_恭喜 | 黑龙江大学自然语言处理实验室获得NLPCC2019跨领域移植中文依存句法分析封闭测试第一名!...

    点击上方,选择星标或置顶,每天给你送干货! 阅读大概需要3分钟 跟随小博主,每天进步一丢丢 欢送师兄师姐毕业 任务介绍 我们做的实验为Task1的closed任务 任务设置 任务描述: 输入一个自然语 ...

  5. 太空测试第一名至联云t01248告诉你,质押率怎么算?

    Filecoin大矿工测试正在进行中,相信很多投资者都对Foilecoin网络的质押机制十分好奇,想在主网上线正式.服务器开始运行之前,了解Filecoin的质押率.下面,至联云就来为大家详解,Fil ...

  6. 一个完美网站的101项指标.第一部分.概述收藏一个完美网站的101项指标第一部分.概述...

    一个完美网站的101项指标 第一部分.概述 前言 世 界上最有趣的职业是网站设计师,有人为自己的作品喊价5000美金,有人129美金就行,而很多人根本看不出这两者的差别,我见过一个加拿大 Freela ...

  7. 计算机系单身率排行榜,中国高校单身率排行榜,第一名实至名归!

    原标题:中国高校单身率排行榜,第一名实至名归! "等你们上了大学就好了" "等你们上大学,想谈恋爱就谈,没人管你" 然而等我上了大学 大一,没有脱单 大二,没有 ...

  8. 一大批中文(BERT等)预训练模型等你认领!

    作者丨Zhe Zhao 机构丨RUC DBIIR & Tencent Research 研究方向丨自然语言处理 项目简介 预训练模型已经成为了 NLP 领域最重要的资源之一.当我们拿到一个 N ...

  9. bert中文预训练模型_HFL中文预训练系列模型已接入Transformers平台

    哈工大讯飞联合实验室(HFL)在前期陆续发布了多个中文预训练模型,目前已成为最受欢迎的中文预训练资源之一.为了进一步方便广大用户的使用,借助Transformers平台可以更加便捷地调用已发布的中文预 ...

最新文章

  1. php 循环写入 缓冲,php利用缓冲实现动态输出(flush,ob_flush)
  2. NGUI从入门到实战(大学霸内部资料)
  3. 计算机网络(二十一)-数据链路层设备
  4. 聚类技术---复杂网络社团检测_基于Plato高性能图计算框架的社团发现算法
  5. 【直播间】移动互联网产品中如何用好HTML5?
  6. python入门到精通 pdf-运维必备Python基础入门到精通.pdf
  7. CentOS7使用yum安装mysql5.7
  8. 服务器如何用光盘拷文件材料,云服务器如何挂载光盘
  9. Ramdisk(内存盘)虚拟磁盘设置使用
  10. PS制作简洁漂亮的立体抽丝文字
  11. imagemagick:a gentle introduction to magick++
  12. JSP 页面缓存以及清除缓存
  13. 匿名发送邮件python_邮箱伪造之搭建匿名SMTP服务器
  14. Ubuntu20.04开启wifi热点
  15. 虚拟服务器和vdi,VDI虚拟化平台搭建 01--VDI基本环境准备
  16. 三.螺丝与核弹。【成长篇】
  17. 编程导师Ivor Horton新作《Java 7入门经典》即将出版
  18. iphone上app store切换国家和地区
  19. 青少年编程教育等级评测(一级)模拟题_1
  20. 开发的激光测距仪PCBA方案设计

热门文章

  1. #研发解决方案#智慧的太空桥管理智慧设备
  2. Nginx平滑升级,并增加清除缓存模块
  3. 由“ASP.NET网站限制访问频率”想到的两点问题(转)
  4. 余额 微信钱包图片_微信储值会员卡小程序,微信会员卡功能系统。
  5. iOS 进阶之底层原理一OC对象原理alloc做了什么
  6. runtime 项目实战方法处理
  7. iphone全部机型_iPhone12卖爆 产业链喜迎5G时代 股价天花板打开?|iphone|iphone12|运营商|智能机...
  8. Xamarin XAML语言教程模板页面TemplatedPage
  9. Web模糊测试工具Powerfuzzer
  10. python源程序执行的方式是什么执行-python调用可执行文件的方法