背景:

首次使用bert做query和documents的 排序工作。
做排序的通用方法:
构建一个分类模型,目标是该doc是否与query相关,预测的结果用于排序,也就是说分类模型得到的是排序文档的候选集。但相比于pairwiese和listwise,这种方式做排序没有考虑doc之间的相关性。
这篇论文,提出TFR-BERT,通用的doc排序方法。用TF预训练了一个query-doc对的bert模型。

TFR-BERT

构建query - doc对,这样每一个query跟doc作为两个句子,拼接一起,如下:
[CLS] query text [SEP] passage text [SEP]
举个例子 :
[CLS] 阿里晋升 [SEP] 4月30号,阿里公布晋升结果和调薪情况 [SEP]

Bert的pooled输出结果作为rank 模型的输入,这样就构建了TF-Ranking模型。这个框架提供了pointwise、pairwise、listwise loss,这样能跟别的LTR方法做比较。

这里有两个概念:

passage re-ranking task:对于每一个query,通过BM25从所有page中 选出top1000,然后再重排序,找出跟query最相关的page。
passage full-ranking task: 从8千万page中直接诶排序,选出出最相关的doc。(如何保证性能?)

五个实验:

1和2是从loss上做优化,3是将召回和排序做ensemble,,4和5主要是模型的ensemble。
1.re-ranking, TF-Ranking + BERT, softmax loss。
2.(re-ranking): TF-Ranking + BERT (Ensemble of pointwise, pairwise and listwise losses)
3. (full ranking): DeepCT Retrieval + TF-Ranking BERT Ensemble
4. (re-ranking): TF-Ranking Ensemble of BERT, RoBERTa and ELECTRA
5. (full ranking): DeepCT + TF-Ranking Ensemble of BERT, RoBERTa and ELECTRA
实验结果显示:
re-rank:
1.从loss作为变量,进行对比,loss ensemble的效果最好。
2.从模型角度,ensemble的模型效果最好,不过不是太显著。

读后,就觉得好像没啥用呢…只是打比赛能看看,很难应用到工作中。

Bert系列:论文阅读Learning-to-rank with bert in tf-ranking相关推荐

  1. Transformer系列论文阅读

    这是博主在五一期间对Transformer几篇相关论文阅读的小笔记和总结 也借鉴参考了很多大佬的优秀文章,链接贴在文章下方,推荐大家前去阅读 该文章只是简单叙述几个Transformer模型的基本框架 ...

  2. dqn系列梳理_系列论文阅读——DQN及其改进

    DQN 作为DRL的开山之作,DeepMind的DQN可以说是每一个入坑深度增强学习的同学必了解的第一个算法了吧.先前,将RL和DL结合存在以下挑战:1.deep learning算法需要大量的lab ...

  3. [论文阅读] Learning Loss for Active Learning

    论文地址:https://arxiv.org/abs/1905.03677 发表于:CVPR'19 Abstract 深度神经网络的性能随着更多的标注数据而提高.问题是用于标注的预算是有限的.解决这个 ...

  4. 论文阅读 Learning Motion in Feature Space: Locally-Consistent Deformable Convolution Networks

    Learning Motion in Feature Space: Locally-Consistent Deformable Convolution Networks for Fine-Graine ...

  5. 论文阅读 Learning Transferable Visual Models From Natural Language Supervisio

    Learning Transferable Visual Models From Natural Language Supervision Computer Vision and Pattern Re ...

  6. 定位系列论文阅读-RoNIN(二)-Robust Neural Inertial Navigation in the Wild: Benchmark, Evaluations

    这里写目录标题 0.Abstract 0.1逐句翻译 0.2总结 1. Introduction 1.1逐句翻译 第一段(就是说惯性传感器十分重要有研究的必要) 第二段(惯性导航是非常理想的一个导航方 ...

  7. [论文阅读] Learning without Memorizing

    论文地址:https://link.springer.com/chapter/10.1007/978-3-319-46493-0_37 代码:https://github.com/stony-hub/ ...

  8. [2022_CVPR_LAV]论文阅读learning from all vehicles

    LAV: learning from all vehicles 这篇论文v2版本已经发布,待看 数据集太大暂时无法全部下载,具体的数据集内容查看mdb文件,待看 主要是大概看了一遍代码,跟以往IL-b ...

  9. SSL for Medical Image Classification系列论文阅读笔记 -- ACPL

    ACPL: Anti-curriculum Pseudo-labelling for Semi-supervised Medical Image Classification(CVPR 2022) C ...

  10. 【定位系列论文阅读】-Indoor Visual Positioning Aided by CNN-Based Image Retrieval: Training-Free(一)

    文章目录 0.论文速览 0.1 文章信息 0.2 概述 0.2.1 研究什么东西 0.2.2 评价 1.Abstract 1.1 逐句翻译 1.2 总结 2.INTRODUCTION 2.1 逐句翻译 ...

最新文章

  1. java实现七日股票问题_七日打卡--JAVA资源限制
  2. selector多路复用_超详细的I/O多路复用概念、常用I/O模型、系统调用等介绍
  3. python的工资待遇-python数据分析师待遇有多少?工资待遇如何?
  4. spring mvc+spring + hibernate 整合(二)
  5. 芯片-模组-开发板-软件开发包SDK(Software Development Kit)的关系(软件开发人员必须了解的硬件知识)
  6. 成为明星程序员的独特秘密|极客原创
  7. Android判断当前线程是否是主线程的方法
  8. 华中师范大学计算机考研论坛,2020年华中师范大学计算机考研经验分享
  9. java 从sip服务器_如何通过域而不是IP地址注册到SIP服务器并从客户端创建SIP帐户?...
  10. 从高德地图获取城市地铁线路+站点
  11. eigen一维向量_Eigen中的矩阵及向量运算
  12. word顶部有一道线_word文档上方总有一条线怎样去掉?
  13. 一行代码轻松搞定各种IE兼容问题,IE6,IE7,IE8,IE9,IE10
  14. 统一诊断服务(UDS)- 安全等级是怎么回事儿
  15. Unable to apply any optimisations to advised method 信息解析
  16. 凌动智行宣布获China AI Capital Limited战略投资 迟睿及李宇成董事会成员
  17. C4D R25调节网格间距的方法
  18. 原生JS实现小米轮播图和网易云轮播图
  19. 复习Java小球游戏代码分享Java面试题MySQL中常用的锁生活【记录一个咸鱼大学生三个月的奋进生活】021
  20. 跨考计算机算同等学力马,跨专业算同等学力吗?

热门文章

  1. 数据处理奇技巧——hive篇
  2. 逻辑回归实战(动手实践)
  3. Mac mini7.1 2014年末 安装单windows 10系统
  4. 如何把微信公众号平台做成找券机器人并自动回复优惠券
  5. prettier和beautify哪个好用
  6. Unity学习场景、模型和粒子资源包,总有一款你能用到,亲测可使用,第一波来袭
  7. spring mvc 配置使用定时任务
  8. sklearn.neighbors_Nearest Neighbors
  9. 三角形周长最短问题_「初中数学」从三角形周长的最值问题说说解题策略
  10. 安卓机自动肝手游脚本