论文简述:
BERT模型已成功地应用于开放域QA任务。然而,以往的工作是通过观察与独立训练实例相同的问题对应的段落来训练BERT,这可能会导致不同段落的答案得分存在不可比性。为了解决这个问题,本文提出了一个多通道的BERT模型来对同一问题的所有段落的答案得分进行全局标准化,这种变化使得我们的QA模型能够通过使用更多的段落找到更好的答案。此外,我们还发现,通过滑动窗口将文章拆分成100字的段落,可以将性能提高4%。通过利用一个通道ranker来选择高质量的通道,多通道BERT获得额外的2%提高。

翻译标准: article,指的是一整篇文章,粒度最大,翻译为篇章 passage,本文指的是篇章的中的一个段落,粒度稍小,统一翻译为文章
paragraph,跟passage类似,粒度应该更小点。翻译为段落。

模型:

  • bert-Rc:每个passage都是独立进行预测,但不可比较。
  • multi-passage bert:通过使用滑动窗口机制来划分篇章为(article)很多个100字的passage,然后进行全局的归一化,得到答案相关的所有文章的得分。
  • 排序机制: 然后排序模块是高质量的文章进行召回,用预测文章与答案的相关性,然后再进入softmax排序。最后出结果

???这里的高质量文章怎么评判的?(前30个)

实验:

  • 滑动窗口效果实验
  • 粒度
  • 排序模块的效果
  • 全局标准化的效果

https://zhuanlan.zhihu.com/p/93402967

2020.07.08_Multi-passage BERT: A Globally Normalized BERT Model for Open-domain Question Answering相关推荐

  1. 论文阅读Leveraging Passage Retrieval with Generative Models for Open Domain Question Answering

    利用段落检索和生成模型进行开放域问答 ACL 2021 论文地址 摘要: 开放域问答的生成模型已被证明具有竞争力,无需借助外部知识.虽然这种方法很有前途,但它需要使用具有数十亿个参数的模型,这些参数的 ...

  2. 2020.07 学习日记

    废话 寒假到现在,在家里玩了5个月,来学校又玩了大半个月.以为会做点东西了就什么都懂了,竟然没做准备就投了字节秋招提前批.结果被挂了之后,又被捞起来面试.可以说十分幸运了,但机会都是留给有准备的人 2 ...

  3. 第十弹:网络公开课,免费学习资源,2020.07.05更新

    第十弹:网络公开课,免费学习资源,2020.07.05更新 按照个人兴趣整理的网络公开课资源导航网址:http://www.trochilidaetechnology.com/ 以下为[网络公开课]领 ...

  4. 猎人手游最新服务器,【猎人mm服务端】2020.07月升级經典手工制作搭建网游服务器...

    [猎人mm服务端]2020.07月升级經典手工制作搭建网游服务器 修改标的物的设置,并修改标的物的销售和价格.修改精制道具的价格,并与掉落的道具统一. 无人岛的经验值增加了紫圣诞鹿(经验值是圣诞怪物的 ...

  5. 312戳气球——力扣算法系列2020.07.19 Python

    第25天 2020.07.19 周日 难度系数:困难 题目:有n个气球,编号为0到n-1,每个气球上都标有一个数字,这些数字存在数组nums中. 现在要求你戳破所有的气球.如果你戳破气球i,就可以获得 ...

  6. 【论文阅读】Dense Passage Retrieval for Open-Domain Question Answering

    Comment: EMNLP 2020 一句话总结 任务:开放域问答中的retriever,从海量文本中选出与问题接近的文本. 方法:采用正负样本对对比学习的方法,使得相关问题与文本对拉近,不相关的拉 ...

  7. acl 2020 Question Answering

    文章目录 2020 Fluent Response Generation for Conversational Question Answering PLATO: Pre-trained Dialog ...

  8. 预训练模型:BERT深度解析《BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding》

    目录 1. 背景 2. 什么是 Bert 及原理? 3. 论文内容<BERT: Pre-training of Deep Bidirectional Transformers for Langu ...

  9. BERT |(3)BERT模型的使用--pytorch的代码解释

    参考代码:https://github.com/649453932/Bert-Chinese-Text-Classification-Pytorch 从名字可以看出来这个是做一个中文文本分类的的任务, ...

最新文章

  1. IOS长按识别二维码失败
  2. PHP获取当前毫秒时间戳
  3. 巧用iptables搞定SYN洪水攻击!
  4. nyoj99(欧拉路)
  5. 【cJSon】cJSON学习笔记(一)
  6. pe下找不到ssd硬盘_【进入pe系统后认不到硬盘解决方法】进入pe系统看不到硬盘_pe系统不认硬盘...
  7. centos7安装es mysql_Centos7 安装MySQL详细步骤
  8. INFO:InstallShield工程中如何将安装包集成的Prerequisites安装文件压缩到一个Setup.exe中...
  9. Rambus推出面向下一代数据中心的PCIe 6.0控制器
  10. 爬虫scrapy模块
  11. oracle序列重置6,oracle 重置序列从指定数字开始的方法详解
  12. 提示microsoft incremental linker已停止工作解决方法
  13. C++中类中常规变量、const、static、static const(const static)成员变量的声明和初始化...
  14. 互换元素(swap,swap_ranges)
  15. java虚拟机有什么作用_java虚拟机有什么用
  16. 2021考研英语大作文笔记(刘晓燕版)
  17. mapgis矢量化怎么打分数_MAPGIS矢量化步骤
  18. Android studio 4.0 offline mode
  19. 《路由器开发 - 路由器刷机指南》小米MINI刷机
  20. Android 短视频 SDK 转场特效的音视频同步分析

热门文章

  1. 文件系统与linux相关知识点
  2. 运用ffmpeg SDK解264码流(来源FFmpeg工程组)
  3. NOX的使用之学习篇【一】
  4. 计算机辅助初中数学教学,计算机辅助数学教学的优势
  5. vue锚链接可以从指定位置显示么_onenote链接系列⑥:链接笔记如何产生?与插入链接的区别...
  6. nginx redis mysql_Nginx + Lua + Kafka + Redis + Mysql
  7. verilog学习记(verilog翻译成c)
  8. linux驱动编写(dma驱动)
  9. 倒序排序_排序不等式,切比雪夫不等式及伯努利不等式
  10. linux版本和特点,Linux与其他系统对比,具有哪些特点?