百度ERNIE登顶GLUE榜单,得分首破90大关
出品 | AI科技大本营(ID:rgznai100)
12月10日,百度ERNIE在自然语言处理领域权威数据集GLUE中登顶榜首,以9个任务平均得分首次突破90大关刷新该榜单历史,其表现超越微软MT-DNN-SMART, 谷歌T5、ALBERT等一众顶级预训练模型。
2018年底以来,以BERT为代表的预训练模型大幅提升了自然语言处理任务的基准效果,取得了显著技术突破,基于大规模数据的预训练技术在自然语言处理领域变得至关重要。众AI公司纷纷发力预训练领域,相继发布了XLNet、RoBERTa、ALBERT、T5等预训练模型。百度也先后发布了ERNIE 1.0、ERNIE 2.0,在16个中英数据集上取得了当时的SOTA。
从GLUE排行榜上来看,BERT使用预训练加微调的方式,相对过往的基线成绩大幅提升各任务的效果,首次突破了80大关。XLNet、RoBERTa、T5、MT-DNN-SMART等模型则分布在88-89分范围,人类水平则是87.1。
百度ERNIE此次登顶,并在CoLA、SST-2、QQP、WNLI等数据集上达到SOTA。相对BERT的80.5的成绩,提升近10个点,取得了显著的效果突破。
百度ERNIE 2.0原理示意图
ERNIE 2.0 持续学习的语义理解框架, 支持增量引入不同角度的自定义预训练任务,通过多任务学习对模型进行训练更新,每当引入新任务时,该框架可在学习该任务的同时,不遗忘之前学到过的信息。
此次登顶的模型主要基于ERNIE 2.0持续学习语义理解框架下的系列优化。引入更多新预训练任务, 例如引入基于互信息的动态边界掩码算法。对预训练数据和模型结构也做了精细化调整。
同时,百度ERNIE 2.0的论文(https://arxiv.org/abs/1907.12412)已被国际人工智能顶级学术会议AAAI-2020收录,AAAI-2020将于2020年2月7日-12日在美国纽约举行, 届时百度的技术团队将会进一步展示近期的技术成果。
据介绍,ERNIE预训练技术已广泛地应用于公司内外多个产品和技术场景,在百度搜索、小度音箱、信息流推荐等一系列产品应用中发挥了重要作用,大幅提升了产品的技术效果和用户体验,逐步赋能各行各业。
(*本文为AI科技大本营整理文章,转载请微信联系 1092722531)
◆
精彩公开课
◆
推荐阅读
数学学渣必备!拍照上传,分步求解,微软解题神器拯救你
蚂蚁金服提新概率图模型GLN,正确率提升8.2%,具备可解释性 | NeurIPS 2019
后深度学习时代的一大研究热点?论因果关系及其构建思路
LatentFusion:华盛顿大学与英伟达联合提出6D姿态估计新方法
那些打着AI万金油旗号的产品欺骗大众,如何识别?
扛住100亿次请求——如何做一个“有把握”的春晚红包系统
「刷新 CTO」微软与 CSDN 的 CTO 转型思想汇
华为鸿蒙 OS 2020 计划曝光!手机仍然优先用安卓
用象棋的思维趣说 IT 人的职业发展和钱途
-
你点的每个“在看”,我都认真当成了AI
百度ERNIE登顶GLUE榜单,得分首破90大关相关推荐
- 百度翻译十年:语种全球首破200大关,质量提升30个百分点,每天翻译超千亿字符...
金磊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 十年,能让一个机器翻译系统发生怎样的变化? 2011年,TA还只会"中-英"翻译这一项技能.但TA却用十年时间,在翻译这 ...
- 重磅!百度多模态模型ERNIE-ViL刷新5项任务纪录,并登顶权威榜单VCR
** 关注[百度NLP]微信官方公众号,及时获取更多自然语言处理技术干货! ** 阅读原文,获取相关论文地址:https://mp.weixin.qq.com/s/nB_yCkEXkgjv7saKpc ...
- NLP界的「MVP」再次夺冠,刷新GLUE榜单
视学算法发布 机器之心编辑部 刷新多项任务分数,百度自研的语义理解技术与平台文心 ERNIE 再次登上了 GLUE 的榜首. 近日,自然语言处理领域权威排行榜--GLUE(通用语言理解评估基准)新排名 ...
- 登顶CLUE榜单,腾讯云小微与腾讯AI Lab联合团队提出基于知识的中文预训练模型...
点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 2018年以来,以BERT.GPT等为代表的大规模预训练模型,带来了 ...
- AMD首款5纳米PC处理器锐龙7000亮相,频率首破5GHz大关,单核性能提升15%
丰色 发自 凹非寺 量子位 | 公众号 QbitAI COMPUTEX(台北电脑展)线上发布会上,苏妈带着AMD新一代锐龙7000系列处理器如约而至. 这款最新CPU升级为5nm Zen4架构,单核性 ...
- ACL 2021 | 百度NLP开源语言与视觉一体的统一模态预训练方法,登顶各类榜单
视学算法报道 机器之心编辑部 百度首创地提出了语言与视觉一体的预训练方法 UNIMO,提供了一种新的统一模态学习范式,打破了文本.图像和图文对等数据间的边界,让机器可以像人一样利用大规模异构模态数据, ...
- 百度 ERNIE 在 GLUE 大赛中击败了微软和谷歌
受中英文差异的启发,ERNIE 的成功表明人工智能研究可以集百家之长. 作者 | Karen Hao 译者 | 弯月,责编 | Elle 出品 | CSDN(ID:CSDNnews) 以下为译文: 本 ...
- 秒拍5月榜单:首推川渝作者原创榜,各榜新面孔持续涌现
6月1日,秒拍发布5月短视频行业系列榜单,包含原创作者榜.风云榜.影响力榜.美食榜.时尚榜.MCN机构榜.川渝作者原创榜七大榜单.自2016年6月起,秒拍每月初推出热门原创短视频PGC榜单:同年9月起 ...
- 百度ERNIE新突破,登顶中文医疗信息处理权威榜单CBLUE冠军
医疗领域存在大量的专业知识和医学术语,人类经过长时间的学习才能成为一名优秀的医生.那机器如何才能"读懂"医疗文献呢?尤其是面对电子病历.生物医疗文献中存在的大量非结构化.非标准化文 ...
最新文章
- 2、计算机图形学——3D变换
- 广西2021高考成绩什么时候可以查询,2021年广西高考成绩什么时候公布出来,几月几号几点钟可以查询...
- jquery获取select中的option的text值
- caffe编译出现 libcudart.so.8.0 cannot open shared object file: No such file or directory的错去
- epp是什么意思_什么是1K/2K/3K注塑?
- Mysql入门的10条语句
- 【读一本书】《昇腾AI处理器架构与编程》--神经网络基础知识(2)
- vue入门:(组件)
- Go基础-核心特性和前景
- pikachu暴力破解(burpsuite)
- 苹果手机清灰_手机听筒喇叭声音越来越小?来试试这三个小技巧
- cocos2dx资料汇总 - 持续更新
- 中兴通讯携MF30打造高速无线网络
- Python使用webdriver爬取百度文库
- 如何操作最快的硬盘对拷工具
- 杭州治堵有“智慧” 阿里云数加激活城市大脑
- html5对锚的更改,HTML5之锚链接
- ei会议论文含金量高吗?
- python入门指南
- YGG 与 Web3 平台 Strider 达成合作,用 DAO 工具和资源为创作社区赋能