文章目录

  • 1 介绍
  • 2 任务定义
    • 2.1 文档检索
    • 2.2 段落检索
  • 3 数据集
  • 4 结果分析
    • 4.1 深度学习与传统方法的对比
    • 4.2 端到端检索与重排的对比
    • 4.3 ORCAS数据的影响
    • 4.4 NIST标签与稀疏的MS MARCO标签的对比
  • 5 总结

1 介绍

概述题目:OVERVIEW OF THE TREC 2020 DEEP LEARNING TRACK
概述来源:TREC 2020
概述链接:https://trec.nist.gov/pubs/trec29/papers/OVERVIEW.DL.pdf

深度学习的方法已经在语音识别和CV领域取得了显著的性能提升,但在信息检索中,并没有显著的性能提升。TREC Deep Learning Track的主要目标是研究在大的训练数据区域中的信息检索,以确定哪种检索方法效果最好。

2 任务定义

分为两个任务:文档检索和段落检索

2.1 文档检索

文档检索任务分为完整检索和top-100重排。

  • 在完整检索子任务中,将根据文档与查询的相关性对文档进行排序,可以从提供的完整文档集合中检索文档。此子任务对端到端检索场景进行建模。
  • 在重排子任务中,给出100个文档的初始排名,对这些文档进行排序。

评测标准:

  • 完成相关:该文档专用于查询,值得成为搜索引擎中的top结果
  • 高度相关:文档提供大量的信息与查询有关
  • 相关:文档提供一些信息与查询有关(可能很少)
  • 不相关: 文档对查询不提供有用的信息

2.2 段落检索

与文档检索类似,分为完整检索和top-1000重排。

  • 在完整检索子任务中,给定一个查询,要求参与者根据他们估计的包含问题答案的可能性,从完整集合中检索段落的排序列表。对于这项端到端检索任务,参与者每次查询最多可以提交1000篇段落。
  • 在重排子任务中,对每个查询提供给参与者1000篇段落,进行重新排名。
    评测标准也类似。

3 数据集

基于人工相关性评估的数据集MS MARCO,同时发布一个大规模点击数据集ORCAS,来源于主流搜索引擎的日志。

4 结果分析

方法分为三类:

  • nnlm:使用大规模预训练语言模型
  • nn:使用深度学习的方法或者词向量
  • trad:传统信息检索方法

评测指标为NDCG@10(Normalized Discounted Cumulative Gain)、Average Precision (AP)和Reciprocal Rank (RR)。

4.1 深度学习与传统方法的对比

可以发现在b图中三中方法的差距是更大,一个原因是在短文本中,查询和相关结果之间的词汇不匹配的概率是更大的。另一个原因是对于段落任务,尽管没有NIST的测试标签,但是已经有了一个公共排行榜
在文档检索任务中,最好的nnlm模型比最好的传统模型在38个(共45个,84%)测试查询上表现好。在段落检索中的结果也类似。

4.2 端到端检索与重排的对比

结果如下图,具体来说,对于文档检索任务,最佳的完整检索比最佳重排高 5%的NDCG@10; 而对于段落检索任务,与最佳的重排相比,最佳的完整检索的性能稍差(NDCG@10低0.3%)

4.3 ORCAS数据的影响

使用ORCAS数据集会提高NDCG@10的性能,最大的增加是在 NDCG@10大约0.0513%。

4.4 NIST标签与稀疏的MS MARCO标签的对比

NIST官方标签更全面,涵盖每个查询的大量结果,并在NIST以四分制进行标记。MS MARCO中对于一个查询通常有一个positive result。
下图展示了一致性,深度学习方法是高的,对于传统方法的文档检索一致性接近为0。

如下图,使用ORCAS数据表现得更好在MS MARCO评测设置上。ORCAS数据集和MS MARCO标签之间的相似性似乎是两个评估结果不匹配的原因之一。

5 总结

  • 虽然使用ORCAS数据集似乎有助于提高系统的性能,但没有必要使用 ORCAS 数据来实现最高的 NDCG@10。
  • 重拍的方法和端到端检索的方法没有大的差距。
  • 使用两种评测标签,在段落检索任务中一致性较高,文档检索任务中一致性较低。
  • 使用ORCAS数据集是低相关性的一个理由。

概述笔记 TREC 2020|OVERVIEW OF THE TREC 2020 DEEP LEARNING TRACK相关推荐

  1. 论文阅读笔记:Improving Attacks on Speck32 / 64 using Deep Learning

    论文阅读笔记:Improving Attacks on Speck32 / 64 using Deep Learning 本文通过神经网络利用了减少轮数的 Speck 的差分性质.为此,作者对神经网络 ...

  2. 李弘毅机器学习笔记:第十二章—Recipe of Deep Learning

    李弘毅机器学习笔记:第十二章-Recipe of Deep Learning 神经网络的表现 如何改进神经网络? 新的激活函数 梯度消失 怎么样去解决梯度消失? Adaptive Learning R ...

  3. 论文阅读:(2020版)A Survey on Deep Learning for Named Entity Recognition 命名实体识别中的深度学习方法

    A Survey on Deep Learning for Named Entity Recognition 命名实体识别中的深度学习方法 目录 A Survey on Deep Learning f ...

  4. 【2020新书推荐】Introduction to Deep Learning

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要5分钟 Follow小博主,每天更新前沿干货 概述 这本教科书提供了一个简明的,易理解的和引人入胜的深度学习的第一个介绍,提供了大量连接主义模 ...

  5. 【论文笔记】Towards Privacy-Preserving Affect Recognition: A Two-Level Deep Learning Architecture

    摘要 使用图像和计算机视觉自动理解和识别人类情感状态可以改善人-机算计交互和人-机器人交互.然而,隐私已成为一个备受关注的问题,因为在此过程中可能会暴露用于训练情感模型的人的身份.例如,怀有恶意的人可 ...

  6. PyTorch学习笔记(19) ——NIPS2019 PyTorch: An Imperative Style, High-Performance Deep Learning Library

    0. 前言 波兰小哥Adam Paszke从15年的Torch开始,到现在发表了关于PyTorch的Neurips2019论文(令我惊讶的是只中了Poster?而不是Spotlight?).中间经历了 ...

  7. 【论文阅读笔记】Real-Time Video Super-Resolution on Smartphones with Deep Learning, Mobile AI 2021 Challenge

    论文地址:https://arxiv.org/abs/2105.08826 论文小结   这比赛的目标是在移动手机上得到实时运行的视频超分算法,目标在480p(实际上是180∗30180*30180∗ ...

  8. 【论文笔记】(JSMA)The Limitations of Deep Learning in Adversarial Settings

    引流:https://www.cnblogs.com/setdong/p/16414390.html 本文是早期的对抗文章,发表于 EuroS&P 2016会议,最主要的工作是:提出了一个生成 ...

  9. Deep Learning(深度学习)学习笔记整理系列三

    Deep Learning(深度学习)学习笔记整理系列 声明: 1)该Deep Learning的学习系列是整理自网上很大牛和机器学习专家所无私奉献的资料的.具体引用的资料请看参考文献.具体的版本声明 ...

最新文章

  1. drools规则引擎可视化_Springboot2(60)集成规则引擎Drools
  2. nginx下启动php-fpm相关错误信息集锦(长期补充)
  3. c# html datatable,C# DataTable使用方法详解
  4. how is sales pipeline retrieved from backend
  5. 云计算的认识和看法_云存储已经成为存储的未来,你的存储跟上节奏了吗?
  6. php radius类,PHP Radius Search
  7. 华为机试HJ23:删除字符串中出现次数最少的字符
  8. linux redis 工具,linux下redis安装 + 工具 putty
  9. 数字信号处理实验——语音信号的数字滤波
  10. 基于微信小程序点餐系统的设计与实现
  11. 史上最全的自动驾驶研究报告(上)
  12. Mac打开终端自动运行命令
  13. meethigher-逆向破解今日校园App加密值
  14. 微信小程序 image-cropper 还原按钮控制
  15. 为快乐工作而生的协同办公管理平台——IBOS!
  16. 树莓派3B+ 安装 `ReSpeaker 4-Mics Pi HAT` 声卡,录音与播放
  17. 一个线上运营着3000+人的游戏,因为我不小心一个DROP DATABASE,全没了。 怎么办??跟我HOLD住!!!...
  18. 导出CAD文件的几种方法
  19. MFC对话框中嵌入D3D
  20. UnsupportedOperationException; ImmutableCollections.uoe

热门文章

  1. IELTS学习(001) - 语法构成原理
  2. 良心整理:PDF工具合集
  3. 网络爬虫的 “ 黑洞 ”
  4. 【Mac 教程系列第 9 篇】如何把 Mac 中的程序坞移动到另一个屏幕
  5. mysql 根据父Id 递归查询所有的子类Id,根据子类Id 递归查询所有的父类 Id
  6. WLAN设备接入过程
  7. 聚焦云上安全,2021首届-西部云安全峰会将在西安召开
  8. Python selenium模拟QQ邮箱登录
  9. 一些对我影响重大的流行歌曲(r11笔记第32天)
  10. xp安装java_在WindowsXP中,如何安装JAVA软件?