Abstract

本文模型 基于 BERT, 是 Natural Question 数据集上的新基线. 相对原始数据集论文中的结果,在长答案和短答案任务上,F1 值分别提高 30% 和 50%.
NQ leaderboard: https://ai.google.com/research/NaturalQuestions
代码:https://github.com/google-research/language/tree/master/language/question_answering/bert_joint

Introduction

大量基本 BERT 的模型不断推进多个 NLP 任务的 SOTA, 在问答领域 SQuAD 2.0 上的表现距离已报告的人类表现仅差 2.5 F1, CoQA 上距离人类表现仅差 6 F1.

本文假设 Natural Question 是比 SQuAD 2.0 和 CoQA 更难的问题,因此可能会称为接下来的研究热点,其原因如下:

  • NQ 中的问题都是由出于真正的好奇心或者出于找到答案来完成其他任务的需要的人们产生的
  • 在人们产生 NQ 中的问题之前,他们并没有见过可能包含答案的文档
  • NQ 中问题

A BERT Baseline for the Natural Questions相关推荐

  1. 谷歌发布自然问答数据集 Natural Questions

    Google 发布用于训练和评估开放领域(Open-domain)问答系统的大型语料库 Natural Questions(NQ).该数据集包含了 30 万个自然产生的问题和对应的回答注释,每个回答都 ...

  2. 论文笔记 EMNLP 2020|Event Extraction by Answering (Almost) Natural Questions

    文章目录 1 简介 1.1 动机 1.2 创新 2 方法 3 实验 1 简介 论文题目:Event Extraction by Answering (Almost) Natural Questions ...

  3. bert [unused*] 特殊符号

    [1] Comparing Transformer Tokenizers https://towardsdatascience.com/comparing-transformer-tokenizers ...

  4. bert获得词向量_BERT烹饪之法:fintune 的艺术

    大数据文摘授权转载自安迪的写作间 作者:ANDY BERT 预训练模型就如宰好待烹的猪,则 finetune 便是烹饪之法,猪头能用来做成香糯浓醇的烧猪头肉,猪蹄能用来做成劲道十足的红烧猪蹄,身上的梅 ...

  5. GPT-2 论文翻译

    GPT-2 论文翻译 基本是机器翻译,也进行了基本的人工矫正,凑活看吧 原论文:<Language Models are Unsupervised Multitask Learners> ...

  6. 2020年NLP所有领域最新、经典、顶会、必读论文

    本资源整理了近几年,自然语言处理领域各大AI相关的顶会中,一些经典.最新.必读的论文,涉及NLP领域相关的,Bert模型.Transformer模型.迁移学习.文本摘要.情感分析.问答.机器翻译.文本 ...

  7. 论文阅读汇总(1)-【篇数:50】

    本人学习所有系列:汇总帖 这一篇文章作为精读/泛读论文的一个汇总贴. 2021-2-3开始,期待数量越来越多,方向越来越具体~ 因为篇幅的原因,一个帖子就放五十篇叭. 后面的汇总: 51-100:51 ...

  8. Google发布超难问答数据集「自然问题」:30万对问答,BERT都达不到70分

    郭一璞 发自 凹非寺  量子位 报道 | 公众号 QbitAI 世界上最大的冰盖在哪里? Google现在想到了一个办法能让AI来回答这个问题,他们开放了一个名叫自然问题(Natural Questi ...

  9. attention seq2seq transformer bert 学习总结 _20201107

    https://blog.csdn.net/weixin_44388679/article/details/102575223 Seq2Seq原理详解 一文读懂BERT(原理篇) 2018年的10月1 ...

最新文章

  1. rancher部署项目Validation failed in API: Deployment.apps“”must be no more than 63 characters问题原因及解决方法
  2. 这个程序员如何以一己之力阻止了 Bug 代码的提交并改变整个 DevOps 世界?
  3. 服务器端的JavaScript
  4. 数论二(hdoj 卡特兰数)
  5. SpringBoot→thymeleaf静态模板
  6. 用python画椭圆解释_怎么用python画椭圆?
  7. 【三维路径规划】基于matlab球面矢量粒子群算法无人机三维路径规划【含Matlab源码 1682期】
  8. C++、QT的物业管理系统
  9. 【ZigBee】JN5169 ZigBee3.0设备入网过程
  10. 2.2CP分解CP-RALS算法推导python实现
  11. nssl 1438.战略威慑
  12. Excel高级图表制作①——电池图/KPI完成情况对比图/重合柱形图
  13. 【融职培训】Web前端学习 第3章 JavaScript基础教程9 内置对象
  14. 面试官说“一开始工资不会给你太高,你可以接受吗?” 怎么怼回去??
  15. 大数据期末课程设计实验案例:网站用户行为分析
  16. 网格员计算机应用基础知识,计算机应用基础(第3版)周南岳(win7office10)期末复习及答案.doc...
  17. 数据资产价值计算研究与实践
  18. 帝国cms常用插件推荐:支付接口、登陆插件
  19. UG10下载的一波三折和教训经验
  20. c语言程序设计a考试题,C语言程序设计模拟试题A(附答案).doc

热门文章

  1. TAZ生成实践(Intel芯片Mac Python 3.7.9)
  2. JS中NaN定义与用法
  3. document onload和window onload的区别?
  4. celery英语_蔬菜介绍:芹菜 Celery
  5. 实时显示当前时间(中文版)
  6. 发现自己的长处,深入自己擅长的事情
  7. 系统安全及应用(操作)
  8. PaddleNLP实战:应用NeZha模型做微博情感6分类
  9. PHP intval() 和 (int) 转换的区别
  10. Lenet、Alexnet 、VGG、 GoogleNet、ResNet模型