Joint Learning of Deep Retrieval Model and Product Quantization based Embedding Index

嵌入索引能够实现快速近似近邻搜索，是目前最先进的深度检索系统不可缺少的组成部分。传统的检索方法往往将嵌入学习和建立索引两个步骤分离，增加了建立索引的时间，降低了检索的准确性。本文提出了一种基于乘积量化的嵌入指标与深度检索模型联合训练的新方法——Poeem，利用梯度直通式估计器、热启动策略和深度检索模型等技术，将两个单独的步骤统一到一个端到端训练中。最优空间分解和吉文斯旋转。大量实验结果表明，该方法不仅显著提高了检索精度，而且索引时间几乎为零。为了便于比较和再现，我们将方法开源。

背景

embidding indexi 的缺点主要问题在于模型训练与索引建立的分离，导致索引建立时间增加，检索精度下降。

量化方法缺点：1)量化步骤作为基于PQ的嵌入指标的核心，具有不可微分的操作，如参数min，使标准的反向传播训练失效。因此，我们利用梯度直通估计器绕过不可微性，以实现端到端训练。2)量化质心随机初始化导致质心分配非常稀疏，参数利用率较低，量化失真较高 3)标准优化乘积量化(OPQ)[9]算法通过正交矩阵对空间进行旋转，进一步降低PQ失真，不能与联合模型一起迭代运行

2 Method

2.1 Revisiting Retrieval Model

一个标准的嵌入检索模型由查询塔

Joint Learning of Deep Retrieval Model and Product Quantization based Embedding Index相关推荐

2019_ICDM_DeepTrust: A Deep User Model of Homophily Effect for Trust Prediction
[论文阅读笔记]2019_ICDM_DeepTrust: A Deep User Model of Homophily Effect for Trust Prediction 论文下载地址: 10.1 ...

Bit-Scalable Deep Hashing with Regularized Similarity Learning for Image Retrieval and Person Re-ide
总结:(1)对基于三元组学习的损失函数利用拉普拉斯矩阵增加了规则化项 (2)通过给hashing code 的每一Bit 给定一个权重,从而实现Bit-Scalable (3)设计tanh-like ...

PaperNotes(9)-Learning deep energy model: contrastive divergence vs. Amortized MLE
Learning deep energy model: contrastive divergence vs. Amortized MLE abstract 1 Introduction 2 Backg ...

Combining Deep Learning with Information Retrieval to Localize Buggy Files for Bug Reports
题目:Combining Deep Learning with Information Retrieval to Localize Buggy Files for Bug Reports 作者:An ...

[译]深度神经网络的多任务学习概览(An Overview of Multi-task Learning in Deep Neural Networks)...
译自:http://sebastianruder.com/multi-task/ 1. 前言在机器学习中,我们通常关心优化某一特定指标,不管这个指标是一个标准值,还是企业KPI.为了达到这个目标,我 ...

CIKM 2021 | Deep Retrieval：字节跳动深度召回模型论文精读
©作者 | 杰尼小子单位 | 字节跳动研究方向 | 推荐算法文章动机/出发点这是一篇字节跳动发表在 CIKM 2021 的论文,这一项工作在字节很多业务都上线了,效果很不错.但是这篇文章整体读 ...

字节跳动Deep Retrieval召回模型笔记
今天讲讲字节的一个召回的文章:<Deep Retrieval: An End-to-End Learnable Structure Model for Large-Scale Recommend ...

【深度学习】多任务学习概览(An Overview of Multi-task Learning in Deep Neural Networks)
1. 前言在机器学习中,我们通常关心优化某一特定指标,不管这个指标是一个标准值,还是企业KPI.为了达到这个目标,我们训练单一模型或多个模型集合来完成指定得任务.然后,我们通过精细调参,来改进模型直 ...

论文翻译七：Adversarial Transfer Learning for Deep Learning Based Automatic Modulation Classification
30天挑战翻译100篇论文坚持不懈,努力改变,在翻译中学习,在学习中改变,在改变中成长- Adversarial Transfer Learning for Deep Learning Based ...

最新文章

Cocos2d-x3.0 TestCPP文件夹笔记

quick cocos2dx 3.x 配置win32工程

python中元组可以比较大小吗_python元组比较

C++中输入一组数字以换行符结束输入

Codeforces Beta Round #51 D. Beautiful numbers 数位dp + 状态优化

打包mac应用_把网址链接打包成电脑软件的制作方法

Python核心编程-细节

latex word相互转换

Windows下用vs2017编译和配置libcurl库（手把手教，适合新人）

使用VSCode时，执行ng serve出错

2015-FCN论文解读

android q beta3更新功能,Android Q Beta 3更新内容：拥抱5G和可折叠设备

用python画折线图

outlook邮箱邮件内容乱码_outlook邮件乱码怎么转换

洛谷P1308统计单词数C语言

解决hashcat报错

锤子便签V2.5产品体验报告

php导入excel先检查,php 如何在导入Excel数据时检查Mysql数据库内容是否存在，避免重复录入？：怎么样筛选excel表格重复的数据库...

iPhone开发网站、论坛和博客

进程、线程、程序的概念与区别

热门文章

Data Stream Median

win11已卸载软件任务栏托盘图标管理开关残留清理

数据结构与算法学习（第一天循环队列）

oracle+dba手记+下载,开工贺礼:Oracle DBA手记第一部开放下载

今日更新【重庆邮电大学】初试复试资料分享(附考研群)

Gram-Schmidt正交化方法（过目不忘）

qt 分裂器的使用

电脑快捷键~实用大全

oracle数据丢失怎么办,Oracle数据库数据丢失？这几种方法教你来恢复~

unity XR Interaction ToolKit配置