目录

  • 一 `Term Reweight`
    • Context-Aware Document Term Weighting for Ad-Hoc Search
    • term weight的predict阶段
      • 1 段落中词的重要性预测
      • 2 document-level weight
      • 3将predict的term weight用于index
      • 4 损失函数
    • true term weight estimate
  • 二 `Document expansion`
    • Document Expansion by Query Prediction
  • 三 `综述`
    • 1 检索流程:
    • 2 经典检索方法
    • 3稀疏检索模型的四种架构。
    • 4两类re-ranker

Term Reweight

Context-Aware Document Term Weighting for Ad-Hoc Search

论文核心:摒弃以往的以TF、词频这种简单的统计学方法为术语分配权重的方法,采用PLM的词表征作为术语特征重要性计算的依据之一。
提出的模型:a Context-aware Hierarchical Document Term weighting framework

文件过长,需切分为几个passage,先对passage中的术语做权值计算,(在前人研究中,提到段落中的词以200-300个词为佳)

term weight的predict阶段

1 段落中词的重要性预测

采用bert对token做embedding,之后,采用linear层得到词的weight。


之后,作者将实值预测缩放为可与现有检索模型一起使用的类似 tf 的整数。我们称这个权重为 tf

信息检索经典文章-1相关推荐

  1. “云时代架构”经典文章阅读感想十二

    云时代架构"经典文章阅读感想十二 (牛逼的架构师是怎么炼成的?) 前几周阅读的三四十岁的大龄程序员,应该如何保持自己的职场竞争力?中提到如何在35岁左右可以实现掌握有核心竞争力.其中之一便是 ...

  2. “云时代架构”经典文章阅读感想十六

    云时代架构"经典文章阅读感想十六 (支付宝架构师眼中的高并发架构) 经过这一学期的阅读,看到最多的一个名词就是高并发. 高并发高并发经常会发生在有大活跃用户量,用户高聚集的业务场景中,如:秒 ...

  3. “云时代架构”经典文章阅读感想八

    "云时代架构"经典文章阅读感想八 (支持百万连接的系统应该如何设计其高并发架构) 连接共分为四个步骤:1建立连接.2.发送请求.3.返回响应.4.断开连接.系统通信就是通过建立连接 ...

  4. 图像处理与计算机视觉经典文章

    **************************************************************************************************** ...

  5. 全世界应当普及的经典文章:另辟蹊径解读《心经》

    全世界应当普及的经典文章:另辟蹊径解读<心经> 全世界应当普及的经典文章 作者:晓知天下  博客网址:http://blog.sina.com.cn/u/1229750423 我们一直都想 ...

  6. 经典文章:一位营销总监的辞职信及回复

    经典文章:一位营销总监的辞职信及回复 一位营销总监的辞职信 某企业,曾花了半年时间,到另一家著名企业去挖来了一位营销总监.在不到三个月的时间里,这位年仅26岁的营销总监就把工作搞得有声有色颇有成绩.然 ...

  7. 《变形金刚》编年史『经典文章变形金刚迷们必看』

                        <变形金刚>编年史『经典文章变形金刚迷们必看』 相信与变形金刚有关的最早生命应该是至尊太君,他到底是什么已经无从考证,现在只知道他掌握着无比先进的科 ...

  8. 【分享】WebForm中DataGrid的20篇经典文章

    1.DataGrid动态模板列更新数据并且分页的例子 http://www.cnblogs.com/lovecherry/archive/2005/03/26/126102.html 2.DataGr ...

  9. [经典文章翻译]A Crash Course on the Depths of Win32 Structured Exception Handling

    转自:[已完工][经典文章翻译]A Crash Course on the Depths of Win32 Structured Exception Handling 原文题目: <<A ...

最新文章

  1. 在CentOS 6.9 x86_64的nginx 1.12.2上开启标准模块ngx_http_auth_request_module实录
  2. 【CF526F】Pudding Monsters
  3. 【论文阅读】A social recommender system using item asymmetric correlation
  4. ABP学习 解决:Update-Database : 无法将“Update-Database”项识别为 cmdlet、函数、脚本文件或可运行程序的名称的问题...
  5. MySQL || 结果排序--聚集函数讲解
  6. Tachyon更名为 Alluxio,并发布1.0版本
  7. linux 正则查找email_Hello Iris简易微博类App开发教程3-查找用户和用户登录
  8. ruby array_在Ruby中使用Array.delete()和Array.delete_at()从Array中移除元素
  9. python3 新式类_python新式类和旧式类区别
  10. Developer Express右键菜单显示汉化
  11. 数据结构HashMap(Android SparseArray 和ArrayMap)
  12. 部署Screego浏览器实现多人共享屏幕
  13. [高项]定性风险分析VS定量风险分析
  14. 如何利用Social Listening从社会化媒体中“提炼”有价值的信息?
  15. 产品经理的工作及职责
  16. 布同:网络服务器的结构设计
  17. 泛泰binx和ota升级包下载工具Android版[2013.6.7提供源代码]
  18. C++进制转换程序(二进制转换为十进制,十进制转换为二进制)
  19. HEVC/H.265面试问题准备(PART 3. 环路滤波+熵编码)
  20. 酷狗社招面试 java_酷狗面试经验

热门文章

  1. html字段靠右对齐,CSS-在HTML标签中右对齐文本的更好方法
  2. Excel如何批量删除数字单元格前的撇号
  3. 存储微博内容小技巧--印象笔记
  4. [Android App] iPhoneX朋友圈小尾巴工具
  5. SpringCloud Zuul配置
  6. 小红书账号分析丨千瓜指数高的小红书账号是否真的优质?
  7. 常用Windows系统进程列表
  8. Weblogic10.3.6升级2021年10月补丁p33172858_1036_Generic.zip实践
  9. 【Vue3】Vue3+Vite前端在组件中直接使用svg图标icon(实现设计稿的icon解决方案)
  10. 项目实战-----产品经理要做什么?