《推荐系统实践》__第1章__好的推荐系统
1.1 什么是推荐系统
在用户没有明确需求时,帮助他们发现感兴趣的新内容。
推荐算法的本质是通过一定的方式将用户和物品联系起来,而不同的推荐系统利用了不同的方式。
1.2 个性化推荐系统的应用
个性化推荐系统需要依赖用户的行为数据。
尽管不同的网站使用不同的推荐系统技术,但总地来说,几乎所有的推荐系统应用都是由前台的展示页面、后台的日志系统以及推荐算法系统3部分构成。
常见的应用有:电子商务、电影/视频网站、个性化阅读、短视频等。
1.3 推荐系统评测
准确的预测并不代表好的推荐。比如说,该用户早 就准备买《C++ Primer中文版》了,无论是否给他推荐,他都准备购买,那么这个推荐结果显然是不好的,因为它并未使用户购买更多的书,而仅仅是方便用户购买一本他本来就准备买的书。 那么,对于用户来说,他会觉得这个推荐结果很不新颖,不能令他惊喜。同时,对于《C++ Primer 中文版》的出版社来说,这个推荐也没能增加这本书的潜在购买人数。
所以,好的推荐系统不仅仅能够准确预测用户的行为,而且能够扩展用户的视野,帮助用户发现那些他们可能会感兴趣,但却不那么容易发现的东西。同时,推荐系统还要能够帮助商家,将那些被埋没在长尾中的好商品,介绍给可能会对它们感兴趣的用户。
1.3.1 推荐系统实验方法
三种评测推荐效果的实验方法:离线实验、在线实验和用户反馈
离线实验:
(1) 通过日志系统获得用户行为数据,并按照一定格式生成一个标准的数据集;
(2) 将数据集按照一定的规则分成训练集和测试集;
(3) 在训练集上训练用户兴趣模型,在测试集上进行预测;
(4) 通过事先定义的离线指标评测算法在测试集上的预测结果。
用户调查/反馈:
在线实验:
在完成离线实验和必要的用户调查后,可以将推荐系统上线做AB测试,将它和旧的算法进行比较。
AB测试是一种在线的分组测试方法。并对不同组的用户采用不同的算法,然后通过统计不同组用户的各种不同的评测指标比较不同算 法,比如可以统计不同组用户的点击率,通过点击率比较不同算法的性能。
一般来说,一个新的推荐算法最终上线,需要完成上面所说的3个实验。
- 首先,需要通过离线实验证明它在很多离线指标上优于现有的算法。
- 然后,需要通过用户调查确定它的用户满意度不低于现有的算法。
- 最后,通过在线的AB测试确定它在我们关心的指标上优于现有的算法。
1.3.2 评测指标
1. 用户满意度
2. 预测准确度
3. 覆盖率
4. 多样性
5. 新颖性
6. 实时性
1.3.3 评测维度
用户维度:活跃度、新用户等
物品维度:物品属性、新物品、流行度等
时间维度:季节、假期、周末等
《推荐系统实践》__第1章__好的推荐系统相关推荐
- 读书笔记--项亮《推荐系统实践》第七章
第七章 推荐系统实例 如何设计一个真实的推荐系统处理不同的数据,根据不同的数据设计算法,并将这些算法融合到一个系统当中是本章讨论的主要问题.本章将首先介绍推荐系统的外围架构,然后介绍推荐系统的架构,并 ...
- 读书笔记--项亮《推荐系统实践》第五章
第五章 利用上下文信息 本章之前提到的推荐系统算法主要集中研究了如何联系用户兴趣和物品,将最符合用户兴趣的物品推荐给用户,但这些算法都忽略了一点,就是用户所处的上下文(context).这些上下文包括 ...
- 读书笔记--项亮《推荐系统实践》第四章
第四章 利用用户标签数据 背景: 推荐系统的目的是联系用户的兴趣和物品,这种联系需要依赖不同的媒介.目前流行的推荐系统基本上通过3种方式联系用户兴趣和物品. 基于物品的算法: 基于用户的算法: 通过一 ...
- 《推荐系统实践》 第四章 利用用户标签数据 读书笔记
推荐系统的目的是联系用户的兴趣和物品,这种联系需要依赖不同的媒介.GroupLens在一篇文章(文章名是"Tagsplanations : Explaining Recommendation ...
- 《推荐系统实践》 第七章 推荐系统实例 读书笔记
从上面的结构可以看到,推荐系统要发挥强大的作用,除了推荐系统本身,主要还依赖于两个条件界 面展示和用户行为数据.关于如何设计推荐系统的界面,笔者没有太多的发言权.不过,如果我们看看目前流行的推荐系统界 ...
- 读书笔记--项亮《推荐系统实践》第三章
第三章 推荐系统冷启动问题 问题背景: 推荐系统需要根据用户的历史行为和兴趣预测用户未来的行为和兴趣,因此大量的用户行为数据就成为推荐系统的重要组成部分和先决条件. 冷启动问题的定义: 在没有大量用户 ...
- 读书笔记--推荐系统实践 第一章
推荐系统实践 编著 项亮 参与创建Resys China推荐系统社区 第一章 好的推荐系统 什么是好的推荐系统?什么样的特征?有哪些评价指标? 1.1 好的推荐系统 信息过载 (Information ...
- 推荐系统实践读书笔记-04利用用户标签数据
推荐系统实践读书笔记-04利用用户标签数据 推荐系统的目的是联系用户的兴趣和物品,这种联系需要依赖不同的媒介.GroupLens在一篇文章中表示目前流行的推荐系统基本上通过3种方式联系用户兴趣和物品. ...
- 微型计算机控制技术黄勤期末,微型计算机控制技术作者黄勤第4章__工控机的抗干扰课案.ppt...
微型计算机控制技术作者黄勤第4章__工控机的抗干扰课案.ppt 第4章 工控机的抗干扰与可靠性技术 4.1 工控机的运行环境 4.2 噪声干扰的抑制措施* 4.3 过程通道的抗干扰措施* 4.4 系统 ...
最新文章
- 模板 - 欧拉路、欧拉回路(一笔画问题)
- 震撼!15项世界互联网领先科技成果发布,将对你的生活产生什么影响?
- java工单自动化流程控件,一种工单审批的自动化处理方法及系统与流程
- rest_framework11:jwt简单例子/自定制基于jwt认证类
- 200 行代码,一行行教你自制微信机器人
- gridview的表头固定
- 自动驾驶 8-4: 最小二乘法和最大似然法 Least Squares and the Method of Maximum Likelihood
- java 租房系统源码,JAVA房屋出租管理系统
- 【游记】记清北学堂国庆刷题班
- MATLAB 生成均匀分布、正态分布、对数正态分布随机数
- CuraEngine源码编译
- 使用scp传输文件 Host key verification failed.解决
- 程序员面试系列(2)非计算机专业程序员
- 海康三维视频融合监控软件系统免费版,支持移动侦测告警
- 360签名工具 linux,360apk签名工具下载
- (个人学习笔记)利用ensight进行EDEM耦合FLUENT后处理
- 【服务监控】关于分布式系统监控的一些思考与总结
- 宝塔linux面板什么原理,宝塔Linux面板是什么
- 《Android 4高级编程(第3版)》(完整书签).pdf
- Linux利用Coda安装python
热门文章
- c/c++结构体如何判断相等而且是否能相互赋值
- RHCSA之基本命令_统计文件内容篇(wc)
- jieba分词TFIDF算法2
- Lua 5.4.4函数、模块注册
- 高通临时首席财务官戴夫·怀斯宣布退休;东芝着手开始研究5bit PLC闪存颗粒;激烈争夺,腾讯SaaS加速器首期成员公布……...
- 很抱歉,OneDrive服务器出现问题,请稍后重试。(错误代码:0x8004def5)
- overflow: hidden的用法
- super-----this
- java 屏幕识别_java – 检测当前屏幕边界
- 全新2007高校BBS 睿智的冷笑话