深度学习核心技术精讲100篇(二十二)-深度解析数学建模核心知识之搜索与推荐模型中用户建模原理
前言
用户建模是搜索与推荐模型的核心技术。其实很多人对用户模型的概念比较模糊,用户模型更多是在产品生命周期中起关键作用,其结合数据、反馈、行为三个方面的信息总结概括出产品用户模型。
01 背景与意义
用户建模是搜索与推荐模型的核心技术。淘宝搜索排序算分的对象是 <user, query, item> 三元组,我们从样本特征表达的角度上来看,item是比较稠密而且稳定的部分,在大样本的环境下,大部分信息都能够被id embedding所表达,相反user是三者中比较稀疏的部分,所以对于user的描述,需要大量的泛化特征。
从模型分类的角度上来看,用户与商品的静态特征作用在于增强模型的泛化性,而用户实时行为的引入与建模,可以大大增强样本之间的区分性,显著地提升模型的分类精度。我们把用户建模的过程看作是对用户的信息抽象和信息组织的过程。
信息抽象方面
我们不断地优化与丰富建模方式:
user profile用来表征用户的静态属性信息;
偏好标签的挖掘,从行为上预测用户的一般性偏好;
实时行为建模,更细粒度的对当前请求下的兴趣刻画与描述。
信息处理方面
我们从行为周期和行为内容方面对用户行为数据进行合理的组织:
从行为周期上,我们将行为序列划分成中短期和长期,分别使用不同的时间跨度,描述不同粒度的兴趣;
从行为内容维度上,直接行为反馈商品和曝光商品分别被用来显式和隐式的表达用户意图,
深度学习核心技术精讲100篇(二十二)-深度解析数学建模核心知识之搜索与推荐模型中用户建模原理相关推荐
- 深度学习核心技术精讲100篇(十二)-DCGAN(对抗生成网络)算法应用及代码实现
前言 一次偶然看到一个换脸的视频,觉得实在是很神奇,于是饶有兴致的去了解一下换脸算法.原来背后有一个极为有意思的算法思想--对抗生成. 随后各种各样的GAN算法以指数级增长的方式涌现出来,比如WGAN ...
- 深度学习核心技术精讲100篇(十九)--GBDT(梯度提升树) 和 Resnet (残差网络)的原理
残差 残差在数理统计中是指实际观察值与估计值(拟合值)之间的差.在集成学习中可以通过基模型拟合残差,使得集成的模型变得更精确:在深度学习中也有人利用layer去拟合残差将深度神经网络的性能提高变强.这 ...
- 深度学习核心技术精讲100篇(三)-层次自适应的多臂老虎机决策算法 ( HATCH )在滴滴中的应用
前言 需要源码的小伙伴参见: Contextual Bandits 算法在推荐场景中的应用源码 https://download.csdn.net/download/wenyusuran/155784 ...
- 深度学习核心技术精讲100篇(十四)-一文带你看懂GPflow的前世今生
什么是GPflow GPflow是一个高斯过程的工具包,接口部分由python实现,内部的部分计算则由Tensorflow实现. 主要特点有二个:一是使用变分推理作为近似方法,二是使用自动微分进行求导 ...
- 深度学习核心技术精讲100篇(十)-机器学习模型融合之Kaggle如何通过Stacking提升模型性能
前言 之前的文章中谈到了机器学习项目中,要想使得使得机器学习模型进一步提升,我们必须使用到模型融合的技巧,今天我们就来谈谈模型融合中比较常见的一种方法--stacking.翻译成中文叫做模型堆叠,接下 ...
- 深度学习核心技术精讲100篇(十六)-搜索引擎Indri系列之如何建立索引 (Indexing)检索评价 (Evaluation)
前言 在为文档集建立索引时,需要执行IndriBuildIndex path-to-to-index_parameter_file.这里的index_parameter_file是xml格式的参数文件 ...
- 深度学习核心技术精讲100篇(十五)-搜索引擎Indri系列之安装及使用
前言 Indri是Lemur项目衍生的一个基于语言模型的新的搜索引擎,由University of Massachusetts和Carnegie Mellon University合作开发. 安装 下 ...
- 深度学习核心技术精讲100篇(十八)-巨量数据下美团是如何实现数据治理的?
背景 大数据时代的到来,让越来越多的企业看到了数据资产的价值.将数据视为企业的重要资产,已经成为业界的一种共识,企业也在快速探索应用场景和商业模式,并开始建设技术平台. 但这里要特别强调一下,如果在大 ...
- 深度学习核心技术精讲100篇(二十八)-由浅入深概览机器学习优化算法
前言 学习算法一直以来是机器学习能根据数据学到知识的核心技术.而好的优化算法可以大大提高学习速度,加快算法的收敛速度和效果.本文从浅层模型到深度模型纵览监督学习中常用的优化算法,并指出了每一种优化算法 ...
最新文章
- [CareerCup] 8.5 Online Book Reader System 在线读书系统
- 【剑指offer】不使用新变量,交换两个变量的值,C++实现
- ThinkPad T61安装Ubuntu9.10全记录
- Python合并两个List
- learn_Day14 内置函数补充、反射、初识面向对象
- 蛇形数组打印(两种形式)
- elementUI使用
- CodeForces - 801C Voltage Keepsake 二分
- getvod.php_php腾讯云点播视频加密
- SqlServer 存贮过程操作类
- MySQL如何执行关联查询
- SAP B1 VS女士的Navision ERP的比较 - 知道如何选择软件
- VBScript经典教程以及函数手册
- 软件项目管理测试文档,软件项目管理具体方法体系示例
- Web前端开发—html基础(3)
- IDEA解决crtl+space与搜狗输入法冲突
- 51单片机入门学习 第六天
- UAP开发步骤详解(很详细哦)---②单据向导开发
- HDU 6555 The Fool(打表整除分块)
- python previous lines reapeted times MemoryError
热门文章
- 视频营销、B2B营销、EDM营销之营销方式大PK
- ST-Link VCP Ctrl驱动安装失败解决(win7 64bits)
- 一道时间复杂度的题目
- html文件里的scr是什么,HTML中关于url、scr、href的区别
- php怎么随机显示6个数,PHP里一个12成员的数组,随机挑出6/3/3个成员(不重复),然后重新赋值,有什么简洁的办法实现?...
- python 删除一段话中某一个字符串开始之后的所有字符串
- docker 训练深度学习_利用RGB图像训练MultiModality的深度学习模型进行图像分割
- 阿里云物模型层初始化代码实现
- C++中的静态成员变量
- 京东软件测试工程师招聘,京东商城软件测试面试经验