背景介绍

语义索引(可通俗理解为向量索引)技术是搜索引擎、推荐系统、广告系统在召回阶段的核心技术之一。语义索引模型的目标是:给定输入文本,模型可以从海量候选召回库中快速、准确地召回一批语义相关文本。语义索引模型的效果直接决定了语义相关的物料能否被成功召回进入系统参与上层排序,从基础层面影响整个系统的效果。

在召回阶段,最常见的方式是通过双塔模型,学习Document(简写为Doc)的向量表示,对Doc端建立索引,用ANN召回。我们在这种方式的基础上,引入语义索引策略 [In-batch Negatives](https://arxiv.org/abs/2004.04906),以如下Batch size=4的训练数据为例:

我手机丢了,我想换个手机     我想买个新手机,求推荐
求秋色之空漫画全集          求秋色之空全集漫画
学日语软件手机上的          手机学日语的软件
侠盗飞车罪恶都市怎样改车     侠盗飞车罪恶都市怎么改车

In-batch Negatives 策略的训练数据为语义相似的 Pair 对,策略核心是在 1 个 Batch 内同时基于 N 个负例进行梯度更新,将Batch 内除自身之外其它所有 Source Text 的相似文本 Target Text 作为负例,例如: 上例中“我手机丢了,我想换个手机” 有 1 个正例(”我想买个新手机,求推荐“),3 个负例(1.求秋色之空全集漫画,2.手机学日语的软件,3.侠盗飞车罪恶都市怎么改车)。

双塔模型-语义索引策略 [In-batch Negatives]相关推荐

  1. 语义检索系统【二】:基于无监督训练SimCSE+In-batch Negatives策略有监督训练的语义索引召回

    搜索推荐系统专栏简介:搜索推荐全流程讲解(召回粗排精排重排混排).系统架构.常见问题.算法项目实战总结.技术细节以及项目实战(含码源) 专栏详细介绍:搜索推荐系统专栏简介:搜索推荐全流程讲解(召回粗排 ...

  2. 从DSSM语义匹配到Google的双塔深度模型召回和广告场景中的双塔模型思考

    ▼ 相关推荐 ▼ 1.基于DNN的推荐算法介绍 2.传统机器学习和前沿深度学习推荐模型演化关系 3.论文|AGREE-基于注意力机制的群组推荐(附代码) 4.论文|被"玩烂"了的协 ...

  3. 涨点利器:推荐系统中对双塔模型的各种改造升级(上)

    双塔各种改造方法概览: 大型推荐系统通常会将整个推荐链路拆分成召回.粗排.精排和重排等多个模块,以达到推荐效果和计算性能之间的平衡. 由于召回模型的候选item通常是海量的全库物品.粗排模型的候选it ...

  4. Facebook向量召回双塔模型

    不知道多少人还记得 <做向量召回 All You Need is 双塔>那篇,那篇介绍了国内外各个大厂做召回的用的双塔模型,其中提到一篇<Embeding-based Retriev ...

  5. 召回模型:DSSM双塔模型

    文章目录 DSSM(2013) DNN for Computing Semantic Features Word Hashing Youtube双塔模型(2019) Modeling Framewor ...

  6. 【推荐系统】双塔模型中的负采样

    作者:十方 推荐模型中双塔模型早已经普及.一个塔学用户表达.一个塔学item表达.很多双塔模型用各种各样的in-batch负采样策略.十方也是如此.往往使用比较大的batchsize,效果会比较好,但 ...

  7. 【推荐算法】双塔模型介绍

    双塔模型的结构不仅在推荐领域的召回和粗排环节中被广泛采用:而且在其它领域,如文档检索.问答系统等都有它的应用场景. 我们常说的双塔模型的结构,并不是一个固定不变的网络,而是一种模型构造思路:即把模型分 ...

  8. 推荐系统中的双塔模型

    文章目录 1. 为什么要学习DSSM双塔模型 2. DSSM模型理论知识 2.1 DSSM模型的原理 2.2 DSSM深度语义匹配模型整体结构 2.2.1 输入层 2.2.2 表示层 2.2.3 匹配 ...

  9. 推荐系统(十七)双塔模型:微软DSSM模型(Deep Structured Semantic Models)

    推荐系统(十七)双塔模型:微软DSSM模型(Deep Structured Semantic Models) 推荐系统系列博客: 推荐系统(一)推荐系统整体概览 推荐系统(二)GBDT+LR模型 推荐 ...

最新文章

  1. 二值网络--Optimize Deep Convolutional Neural Network with Ternarized Weights and High Accuracy
  2. 网购切莫小看1毛钱 暗藏信用卡诈骗玄机
  3. Service Mesh 实践指南:从单体应用到 Service Mesh 的曲折历程
  4. 在Flutter中解析复杂的JSON(一篇顶十篇)
  5. ArcIMS 投影问题 如何向地图配置文件中添加投影信息(转载)
  6. 【深度学习】深度学习之Pytorch基础教程!
  7. datagridview绑定数据源不显示_sharding-jdbc系列之 数据源配置(一)
  8. python程序的name的作用是什么_python 中__name__ = '__main__' 的作用,到底干嘛的?
  9. Zookeeper学习笔记之 Zab协议(Zookeeper Atomic Broadcast)
  10. Java案例:泛型用法演示
  11. php处理html数据类型,PHP html_entity_decode() 函数 | 菜鸟教程
  12. 如何用 RFM 模型扒出 B 站优质 UP 主?| 附实战代码
  13. JQuery弹出菜单时禁止页面(body)滚动
  14. 深入学习之mysql(二)表的操作
  15. 使用Composer部署laravel框架
  16. 搭建kettle 源码工程报[ui/spoon.xul]找不到错误的解决方案
  17. C#求学之路MVC《医院管理系统》项目研发文献
  18. 王煜全:AI独角兽必须进行业务升级 否则必死无疑
  19. 小米手机第三方卡刷软件_小米Max卡刷教程_小米Max用recovery刷第三方系统包
  20. ElasticSeach 监控之cerebro

热门文章

  1. 【Leetcode】1564. Put Boxes Into the Warehouse I
  2. BUUCTF [安洵杯 2019]easy_serialize_php
  3. 下载谷歌浏览器旧版本的方法
  4. 使用Python将mat文件转换为npy文件
  5. HEX文件和BIN文件转换
  6. leetcode——【猫和老鼠】
  7. 如何清除 iPhone 上的其他存储来释放空间
  8. kindeditor+粘贴word图片
  9. 危化品化工企业双重预防机制五有标准是什么包括哪些内容
  10. 【教学类-23-01】20221217《不会写学号的中班幼儿的学号描字贴》(中班描字)