用户行为数据

为了让推荐结果个性化,就需要深入了解用户。生活中通过“听其言,观其行”来了解一个人。而对于算法,则是分析用户行为日志。

用户行为在个性化推荐系统中一般分成两种-- 显性反馈行为和隐性反馈行为。显性反馈行为包括用户明确表示对物品喜好的行为,比如对商品评分,喜欢或不喜欢。隐性反馈行为指的是那些不能明确反馈客户喜好的行为,比如用户浏览行为。相比于显性反馈,隐性反馈虽然不明确,但数据量更大。在很多网站中,很多用户只有隐性反馈行为,没有显性反馈行为。比如我从来不会对看过的电影,购买过的商品,听过的音乐进行评论。

用户行为有很多种,比如浏览网页,购买商品,评论,评分等。。。要用一个同一的格式表示所有的这些行为是比较困难的。下表给出了一种表示方式,将一个用户行为表示为6 部分,即产生行为的用户和行为的对象(这两个是任何表示形式中不可少的),行为的种类,产生行为的上下文,行为的内容和权重。

长尾分布

1932年,哈佛大学的语言学家Zipf 在研究英文单词词频时发现,如果将单词出现的频率按照由高到低排列,则每个单词出现的频率和它在热门排行榜中排名的常数次幂成反比。这个分布被称为 Zipf 定律。

很多人员发现,用户行为数据也蕴含着这种规律。令 fu(k) 为对k 个物品产生过行为的用户数,fi(k) 为被k 个用户产生过行为的物品的数量。我们选择 Delicious 和 CiteULike 数据集一个月的原始数据进行分析,物品流行度的长尾分布和用户活跃度的长尾分布如下:

用户活跃度和物品流行度的关系

一般来说,不活跃的要么是新用户,要么是只来过网站一两次的老用户。一般认为,新用户倾向于浏览热门的物品,而老用户会逐渐开始浏览冷门的物品。图2-5 展示了 MovieLens 数据集中用户活跃度和物品流行度之间的关系,这表明用户越活跃,越倾向于浏览冷门的物品。

实战智能推荐系统(6)-- 用户行为分析相关推荐

  1. Python项目实战 —— 04. 淘宝用户行为分析

    Python项目实战 Python项目实战--目录 Python项目实战 -- 04. 淘宝用户行为分析 一.背景 二.解题思路 三.数据分析 3.1 数据清洗 3.2 数据分析 3.2.1 用户整体 ...

  2. 数据分析实战之淘宝用户行为分析(3) -- 用户行为路径分析

    数据分析实战之淘宝用户行为分析(3) -- 用户行为路径分析 淘宝行为分析Tableau可视化展示 数据分析实战之淘宝用户行为分析(5) - 数据分析报告 数据分析实战之淘宝用户行为分析(4) - 用 ...

  3. 实战智能推荐系统(14)-- 推荐系统架构

    外围架构 一般来说,每个网站都有一个 UI 系统,UI 系统负责给用户展示网页并和用户交互.网站会通过日志系统将用户在 UI 上的各种各样的行为记录到用户行为日志中. 从上面的结构可以看到,除了推荐系 ...

  4. Python 数据分析实战案例:京东用户行为分析

    1.项目背景 项目对京东电商运营数据集进行指标分析以了解用户购物行为特征,为运营决策提供支持建议.本文采用了MySQL和Python两种代码进行指标计算以适应不同的数据分析开发环境. 2.数据集介绍 ...

  5. 实战智能推荐系统(5)-- 推荐系统评价指标

    1.用户满意度 用户作为推荐系统的重要参与者,其满意度是评测推荐系统的最重要指标.但是,用户满意度没有办法离线计算,只能通过用户调查或者在线实验获得. 2.预测准确度 预测准确度可以用评分预测和Top ...

  6. 实战智能推荐系统(1)-- 个性化推荐系统及其基本推荐算法

    个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务. 推荐系统有3个重要的模块:用户建模模块,推荐对象模块,推荐算法模块. ...

  7. 数据分析项目实战1——淘宝用户购买行为分析(天池)

    一.分析背景.数据来源.数据解释 https://tianchi.aliyun.com/dataset/649 由于userbehavior数据集的数据量较大,本次分析使用Navicat将前10万条数 ...

  8. 数据分析实战:淘宝用户行为分析

    文章目录 1. 数据概述 2. 分析思路 提出问题 提出假设 数据分析 3. 数据预处理 选择子集 补全表格 删除重复值 处理缺失值 处理日期时间(数据一致性) 异常值处理 表格预览 4. 数据分析 ...

  9. SSM旅客行程智能推荐系统的设计与实现 计算机毕设源码21629

    目  录 摘要 1 绪论 1.1研究背景与意义 1.2研究内容 1.3ssm框架介绍 1.4论文结构与章节安排 2旅客行程智能推荐系统系统分析 2.1 可行性分析 2.1.1 技术可行性分析 2.1. ...

最新文章

  1. 关于MYSQL中like 检索汉字问题。
  2. leetcode Merge Two Sorted Lists
  3. 学计算机的女生是一种怎样的存在?
  4. 前端学习(2251)提交代码
  5. 前端学习(808):复杂数据类型传参
  6. ubuntu下动态链接库的编译和使用实例
  7. SMTP、POP3、IMAP的区别
  8. 开发环境 测试环境 定义_如何快速搭建ES开发测试环境?
  9. windows下matplotlib.pyplot图像中显示中文的方法
  10. layer j基本属性
  11. JavaScript 页面刷新方式汇总
  12. web前端如何提升自我
  13. ViewState EnableViewState 禁用与使用心得
  14. MTK手机官方ROM提取教程
  15. 华擎J3455-ITX黑群晖6.2.3-25426搭建
  16. Android 关于ApplicationInfo flags快速了解
  17. getinfo()java,Java Provider getInfo()用法及代碼示例
  18. 【剑指 Offer(专项突击版)前100题】
  19. 达人评测:i5-1135g7相当于什么水平-i5-1135g7是低压吗
  20. Aop介绍 ,aop使用 aop解释

热门文章

  1. 【BI学习心得15-数据分析思维】
  2. 服务器搭建hue_Hue安装配置实践
  3. explore_UserGuide
  4. 关于成本核算方法、步骤、成本分析
  5. C++ Opencv中Mat的操作
  6. 当前时间、既定时间后的时间及时间比较大小(java实现)
  7. 解决ZooKeeper配置中出现Error contacting service. It is probably not running.
  8. 怎么知道一个日期是一年中的第几周?
  9. AtCoder Beginner Contest 217 A B C D E G 题解
  10. Fidder快速上手使用