基于用户标签的时间衰减因子
转自:https://my.oschina.net/xiaoluobutou/blog/686183
背景
依据用户发帖子所属于的分类,给用户打标签,并确定标签的权重。
比如:A用户总共发了8个贴子,其中有1个帖子属于spark分类,3个属于hadoop分类,4个属于storm分类。系统会给用户分别打个spark,hadoop,storm三个标签,但是这三个标签的权重该怎么确定呢?
有一种简单的方案:用贴子的数量做为权重,那在这个例子中,spark权重就是1,hadoop权重就是3,storm权重就是4。这样是有问题的,比如如果4个跟storm相关的帖子是前年发的,而3个跟hadoop相关的帖子是近一周发的。这样的话,只计算数量,storm的权重比hadoop的权重高,看上去不合理,因为没有考虑到时效性,在我们看来,hadoop分类下的帖子数量虽然没storm的帖子数量多,但是发帖的时间距离现在比较近,更能反应发帖者目前的状态。
指数衰减
某个量的下降速度和它的值成比例,称之为服从指数衰减。用符号可以表达为以下微分方程,其中N是指量,λ指衰减常数。
方程的一个解为:
这里N(t)是与时间t有关的量,N0 = N(0)是初始量,即在时间为零时候的量。
衰减速率的测定
平均寿命
如果这个衰减量是一个集合中的离散元素,可以计算元素留在集合中的平均时间长度。这被称为平均寿命(一般称寿命)。并且它可以被证明与衰减速率有关。
平均时间(或被称为指数时间常数)由此被看做一个简单的缩放时间:
因而,这是量减少到初始量的1/e所需要的时间。
利用指数衰减函数做为时间衰减因子,这个也是 牛顿冷却定律 最终的一个形态,标签的权重可以称为标签的热度,权重越大,热度就越高,时间衰减因子体现了标签的热度随着时间逐渐冷却的过程。
基于用户标签的时间衰减因子相关推荐
- 使用TF-IDF对UGC基于用户标签推荐算法的改进
基于 UGC 的推荐 用户用标签来描述对物品的看法,所以用户生成标签(UGC)是联系用户和物品的纽带,也是反应用户兴趣的重要数据源 一个用户标签行为的数据集一般由一个三元组(用户,物品,标签)的集合表 ...
- 基于用户标签的活跃人群特征分析_基于用户行为模型的客流量分析与预测
基于用户行为模型的客流量分析与预测① 程求江 1,2, 彭艳兵 2 [摘 要] 摘 要:为了预测无线城市接入中商圈的短时客流量 , 通过分析顾客 购物行为模式 , 提出了一种基于停留时间和区间活跃度的 ...
- 基于用户标签的活跃人群特征分析_用户特征分析(行为分析是关键)
互联网产品早已进入定制化阶段,千人千面的基础就是用户特征分析.实现的逻辑就是打标签.分类.定制方案. 用户特征分析 - 打标签 用户特征分析的基本概念. 用户特征分析实际上就是知道用户是什么样的人,需 ...
- 推荐算法(3):利用用户标签数据
推荐算法(1):协同过滤总结 推荐算法(2):基于内容的推荐 推荐算法(3):利用用户标签数据 推荐算法(4)利用上下文信息 推荐算法(5)利用社交网络数据 推荐算法(6) 实例 推荐算法(7)缺失的 ...
- 【原创干货】用户标签/用户分群在DMP(数据管理平台)中的应用 | SG小组第一期
前言: SG小组(Study Group)是几个在杭州的产品经理小伙伴基于兴趣而自发组建的学习小组,我们每周会定期开展学习和讨论会,以期通过分享讨论各自熟悉的领域和正在进行的产品项目来达到互相提升的目 ...
- video 微信 标签层级过高_基于大数据的用户标签体系建设思路和应用
在大数据时代,数据在呈现出海量化.多样化和价值化变化的同时,也改变了传统IT行业的市场竞争环境.营销策略和服务模式.如何在ZB级的海量数据中获取并筛选有价值的信息,是对IT企业的一大挑战,通过构建客户 ...
- 基于用户行为的兴趣标签模型
随着网站规模的扩大,内容也相应的与日俱增,涵盖的频道也越来越繁杂,在如此海量的信息平台下,如何更好的服务用户成了各门户网站的首要任务.从用户需求的角度考虑,对内容的判断标准无疑是用户对此内容是否感兴趣 ...
- 推荐系统之用户标签,以及基于标签的算法
目录 一.用户标签 1.维度 2.阶段 3.打标签的方式 4.如何给用户推荐标签 二.基于标签的算法 1.SimpleTagBased 2.NormTagBased 3.TagBased-TFIDF ...
- Python+Django+Mysql实现在线音乐推荐系统 基于用户、项目、兴趣标签的协同过滤推荐在线音乐系统、用户兴趣标签推荐系统 代码实现 源代码下载
Python+Django+Mysql实现在线音乐推荐系统(基于用户.项目的协同过滤推荐算法) 一.项目简介 1.开发工具和实现技术 pycharm2020professional版本,python3 ...
- 大数据 客户标签体系_基于大数据的用户标签体系建设思路和应用
如何设计一个完善的用户标签体系?怎么打标签?打哪些标签?谁来打?怎么使用用户标签创建商业价值? 在大数据时代,数据在呈现出海量化.多样化和价值化变化的同时,也改变了传统IT行业的市场竞争环境.营销策略 ...
最新文章
- 【机器学习基石笔记】八、噪声和错误
- Requirejs2.0笔记
- python高阶函数心得体会_Python高阶函数使用总结
- 编码实战Web端联系人的增删改查
- 2020 . NET大会日程公布!行程亮点全曝光
- mysql根据注释搜索表
- html5标签兼容低版本浏览器
- 不会写代码也可以, 手把手教你制作炫酷生日祝福网页(程序员专属情人节表白网站)
- asp.net网页版斗地主 已提供下载(开源) 测试版
- 浏览器通过域名查找IP地址的过程
- 物联网商机发展空间无限、远大于互联网,物联网创业和项目也有坑——物联网避坑指南之1
- Autofac之类型注册
- 基于unity的2D横版游戏开发日志 小结
- Python+NumPy中的diag函数(简易理解)
- 算法基础之二叉树理论
- 《剑指offter》第十九题(js)
- 倾斜补偿的电子罗盘(3):椭球拟合,磁传感器软磁干扰和硬磁干扰的9参数校准
- 网络加速_蓝汛安全CDN加速解决方案,维稳网络安全
- TOM收费邮箱稀缺终身会员邮靓号现收藏热潮
- 众包数据库管理、时空众包、移动群智感知方向的综述整理——附思维导图
热门文章
- linux 4g 切换 有线网,4G和有线网络的自动切换
- 统计遗传学:第四章,GWAS分析
- tableau计算同环比
- 对偶式与反函数_对偶式和反函数什么关系,是不是都是一样,还是怎么回事啊,...
- 都2022年了,这11个Java开发工具你还不知道?
- IDEA这些既好用又好玩的三十多个宝贝插件你还不知道吗?
- 码教授|面试官:你还有什么要问我的吗?
- 计算机办公软件基础知识题库,办公软件基础知识试题试卷--题库.doc
- 英语基础语法学习笔记 0
- Windows10教育版升级至专业版的方法