信息检索经典文章-1
目录
- 一 `Term Reweight`
- Context-Aware Document Term Weighting for Ad-Hoc Search
- term weight的predict阶段
- 1 段落中词的重要性预测
- 2 document-level weight
- 3将predict的term weight用于index
- 4 损失函数
- true term weight estimate
- 二 `Document expansion`
- Document Expansion by Query Prediction
- 三 `综述`
- 1 检索流程:
- 2 经典检索方法
- 3稀疏检索模型的四种架构。
- 4两类re-ranker
一 Term Reweight
Context-Aware Document Term Weighting for Ad-Hoc Search
论文核心:摒弃以往的以TF、词频这种简单的统计学方法为术语分配权重的方法,采用PLM的词表征作为术语特征重要性计算的依据之一。
提出的模型:a Context-aware Hierarchical Document Term weighting framework
文件过长,需切分为几个passage,先对passage中的术语做权值计算,(在前人研究中,提到段落中的词以200-300个词为佳)
term weight的predict阶段
1 段落中词的重要性预测
采用bert对token做embedding,之后,采用linear层得到词的weight。
之后,作者将实值预测缩放为可与现有检索模型一起使用的类似 tf 的整数。我们称这个权重为 tf
信息检索经典文章-1相关推荐
- “云时代架构”经典文章阅读感想十二
云时代架构"经典文章阅读感想十二 (牛逼的架构师是怎么炼成的?) 前几周阅读的三四十岁的大龄程序员,应该如何保持自己的职场竞争力?中提到如何在35岁左右可以实现掌握有核心竞争力.其中之一便是 ...
- “云时代架构”经典文章阅读感想十六
云时代架构"经典文章阅读感想十六 (支付宝架构师眼中的高并发架构) 经过这一学期的阅读,看到最多的一个名词就是高并发. 高并发高并发经常会发生在有大活跃用户量,用户高聚集的业务场景中,如:秒 ...
- “云时代架构”经典文章阅读感想八
"云时代架构"经典文章阅读感想八 (支持百万连接的系统应该如何设计其高并发架构) 连接共分为四个步骤:1建立连接.2.发送请求.3.返回响应.4.断开连接.系统通信就是通过建立连接 ...
- 图像处理与计算机视觉经典文章
**************************************************************************************************** ...
- 全世界应当普及的经典文章:另辟蹊径解读《心经》
全世界应当普及的经典文章:另辟蹊径解读<心经> 全世界应当普及的经典文章 作者:晓知天下 博客网址:http://blog.sina.com.cn/u/1229750423 我们一直都想 ...
- 经典文章:一位营销总监的辞职信及回复
经典文章:一位营销总监的辞职信及回复 一位营销总监的辞职信 某企业,曾花了半年时间,到另一家著名企业去挖来了一位营销总监.在不到三个月的时间里,这位年仅26岁的营销总监就把工作搞得有声有色颇有成绩.然 ...
- 《变形金刚》编年史『经典文章变形金刚迷们必看』
<变形金刚>编年史『经典文章变形金刚迷们必看』 相信与变形金刚有关的最早生命应该是至尊太君,他到底是什么已经无从考证,现在只知道他掌握着无比先进的科 ...
- 【分享】WebForm中DataGrid的20篇经典文章
1.DataGrid动态模板列更新数据并且分页的例子 http://www.cnblogs.com/lovecherry/archive/2005/03/26/126102.html 2.DataGr ...
- [经典文章翻译]A Crash Course on the Depths of Win32 Structured Exception Handling
转自:[已完工][经典文章翻译]A Crash Course on the Depths of Win32 Structured Exception Handling 原文题目: <<A ...
最新文章
- 在CentOS 6.9 x86_64的nginx 1.12.2上开启标准模块ngx_http_auth_request_module实录
- 【CF526F】Pudding Monsters
- 【论文阅读】A social recommender system using item asymmetric correlation
- ABP学习 解决:Update-Database : 无法将“Update-Database”项识别为 cmdlet、函数、脚本文件或可运行程序的名称的问题...
- MySQL || 结果排序--聚集函数讲解
- Tachyon更名为 Alluxio,并发布1.0版本
- linux 正则查找email_Hello Iris简易微博类App开发教程3-查找用户和用户登录
- ruby array_在Ruby中使用Array.delete()和Array.delete_at()从Array中移除元素
- python3 新式类_python新式类和旧式类区别
- Developer Express右键菜单显示汉化
- 数据结构HashMap(Android SparseArray 和ArrayMap)
- 部署Screego浏览器实现多人共享屏幕
- [高项]定性风险分析VS定量风险分析
- 如何利用Social Listening从社会化媒体中“提炼”有价值的信息?
- 产品经理的工作及职责
- 布同:网络服务器的结构设计
- 泛泰binx和ota升级包下载工具Android版[2013.6.7提供源代码]
- C++进制转换程序(二进制转换为十进制,十进制转换为二进制)
- HEVC/H.265面试问题准备(PART 3. 环路滤波+熵编码)
- 酷狗社招面试 java_酷狗面试经验
热门文章
- html字段靠右对齐,CSS-在HTML标签中右对齐文本的更好方法
- Excel如何批量删除数字单元格前的撇号
- 存储微博内容小技巧--印象笔记
- [Android App] iPhoneX朋友圈小尾巴工具
- SpringCloud Zuul配置
- 小红书账号分析丨千瓜指数高的小红书账号是否真的优质?
- 常用Windows系统进程列表
- Weblogic10.3.6升级2021年10月补丁p33172858_1036_Generic.zip实践
- 【Vue3】Vue3+Vite前端在组件中直接使用svg图标icon(实现设计稿的icon解决方案)
- 项目实战-----产品经理要做什么?