下面简单介绍书中提到的问题以及有哪些解决办法,方便大家对正本书有个整体的把握,同时我也会上传这本书的高清PDF版,本来想不用积分下载,但是系统最少2个,要是哪位没有积分,可以私信我。下载链接如下:

http://download.csdn.net/download/wtt561111/10163609

其他章节内容

推荐系统实践---第一章:好的推荐系统

推荐系统实践---第二章:利用用户行为数据

推荐系统实践---第三章:推荐系统冷启动问题

推荐系统实践---第四章:利用用户标签数据

推荐系统实践---第五章:利用上下文信息

推荐系统实践---第六章:利用社交网络数据

推荐系统实践--第七章:推荐系统实例 第八章:评分预测问题

在实际系统中,数据结构不一样,需要根据不同的数据设计推荐算法,并将这些算法融合到一个系统中。本章将首先介绍推荐系统的外围架构(推荐系统要与网站的其他系统进行对接),然后介绍推荐系统的架构,并对架构中的每个模块的设计进行深入讨论。

7.1    推荐系统外围的架构

主要组成部分:一般来说,每个网站都有一个UI系统,负责给用户展示并与用户进行交互。网站会通过日志系统将用户在UI的各种各样的行为记录到用户行为日志中。日志可以临时存储在内存缓存中,也可以存储在数据库中,也可以存储在文件系统中。推荐系统通过分析用户的行为日志,给用户生成推荐列表,最终展示在网站的界面上。

数据收集和存储:针对不同的行为的特点,需要不同的存储方式。书中给了一个表格,列出了不同的用户行为采取的不同存储方法。

7.2    推荐系统的架构

特征联系目标用户和待推荐商品:书中画出一张图,表示“UserCF,ItemCF,基于特征的推荐”这三种推荐算法中,用户和商品的联系方式,可以全部抽象为基于特征的推荐。但是需要考虑的特征很多,主要包括三种:人口统计学特征,用户的行为特征,用户的话题特征。此外系统的推荐任务也很多。如果同时考虑所有特征,完成所有推荐任务,那么这个推荐系统会很复杂,而且很难通过配置文件方便的配置不同特征和任务的权重。因此,推荐系统需要由多个推荐引擎组成,每个推荐引擎负责一类特征和一种任务,而推荐系统的任务就是将推荐引擎的结果按照一定的权重或者优先级进行合并和排序。

7.3    推荐引擎的架构

推荐引擎的架构:具体可以结合书中的图和例子进行理解。

生成用户特征向量:用户的特征主要包括两种:注册信息,行为信息。对于注册信息,可以直接放到内存用。需要重点考虑的是如何计算出用户的行为特征。特征向量由特征以及特征的权重组成。

利用用户行为计算特征向量时需要考虑:用户行为的种类(用户付出代价越大的行为权重越高);用户行为的时间(时间越近,权重越大);用户行为的次数;物品的热门程度(需要加重不热门物品对应的特征的权重)。

特征与物品相关的推荐:在拿到用户的特征向量后,我们可以根据离线的相关表得到初始的物品推荐列表。离线相关表可以存储在MYSQL中,存储格式(特征ID,物品ID,权重)。该表存储了一种推荐引擎(不是一个特征)的推荐结果,可以通过对该标的查询,获得某个特征下,权重最高的前N个物品。不同的推荐引擎会产生不同的离线表。当进行在线推荐时,会将这些相关表按照配置的权重相加,然后将最终的相关表保存在内存中,最后推荐给用户。

过滤模块:需要过滤的物品包括:用户已经产生过行为的物品;候选集以外的物品(产品需求;用户选择的区间内的物品);某些质量很差的物品;

排名模块:新颖性;多样性;时间多样性;用户反馈;(书中讲的比较简单仔细)

第八章:评分预测问题

前面介绍的推荐系统都是TOPN推荐问题,其实推荐系统在理论研究中比较重要的话题是评分预测问题。

利用用户---评分矩阵,预测某个用户对某个物品的分数,该分数代表了该用户对该商品的喜爱程度。

书中介绍的评分预测算法和前面提到的算法差不多,感兴趣的可以自己去看书。

推荐系统实践--第七章:推荐系统实例 第八章:评分预测问题相关推荐

  1. 《推荐系统实践》样章:如何利用用户标签数据

    <推荐系统实践>样章:如何利用用户标签数据 推荐系统的目的是联系用户的兴趣和物品,这种联系需要依赖于不同的媒介.GroupLens在文章1中认为目前流行的推荐系统基本上通过三种方式来联系用 ...

  2. 读书笔记--项亮《推荐系统实践》第一章

    第一章 好的推荐系统 1.1 前言 推荐系统的基本任务是联系用户和物品,解决信息过载的问题 分类目录和搜索引擎各自存在的问题: 分类目录: 搜索引擎:搜索引擎需要用户主动提供准确的关键词才能寻找信息 ...

  3. 欧式期权matlab编码蒙特卡罗方法,基于MATLAB的金融工程方法与实践第七章 基于蒙特卡洛方法的期权定价.ppt...

    蒙特卡洛的优缺点 MCMC方法的优点 分布假设更一般,描述市场因素可能变化的统计分布既可以是正态.对数正态的,也可以是带跳的扩散分布.t分布等. 随机生成风险因素的各种各样的未来假想情景,可在模型中融 ...

  4. 《推荐系统实践》 第七章 推荐系统实例 读书笔记

    从上面的结构可以看到,推荐系统要发挥强大的作用,除了推荐系统本身,主要还依赖于两个条件界 面展示和用户行为数据.关于如何设计推荐系统的界面,笔者没有太多的发言权.不过,如果我们看看目前流行的推荐系统界 ...

  5. 【读书笔记】推荐系统实践·第四章·利用用户标签数据

    代码方面,主要实现了4.3和4.2.2的一个验证统计,4.4的代码本来准备写一下的,后来因为杂碎的统计工作太多就放弃了.代码和笔记的word版放在https://github.com/littleli ...

  6. 《推荐系统实践》第二章 利用用户行为数据

    2.1 用户行为数据简介 在电子商务网站中行为主要包括网页浏览.购买.点击.评分和评论等. 用户行为在个性化推荐系统中一般分两种--显性反馈行为(explicit feedback)和隐性反馈行为(i ...

  7. 推荐系统实践 - 第1章

    1.互联网搜索及推荐发展 1)早期的孤岛式网站,门户网站出现,网站导航,属于针对网站的推荐.但是内容的获取还是需要到相应网站上去浏览. 2)搜索引擎:用户可以主动检索内容 3)推荐系统:主动的推荐用户 ...

  8. 推荐系统实践 - 第2章

    1.发掘用户兴趣 1)啤酒和尿布的故事 2)用户行为数据:session log.impression log.click log.这些日志记录了用户的行为:浏览.购买.点击.评分.评论 3)用户行为 ...

  9. python从入门到实践笔记_Python编程从入门到实践二至七章笔记

    Python 第二章变量和简单数据类型 一. 改变字符大小写 1. 首字母大写 .title() 或者 .capitaliza() 输入: print("xiao ming!".t ...

  10. Python编程:从入门到实践-第七章:用户输入和while循环(语法)

    #7-1 汽车租赁:编写一个程序,询问用户要租赁什么样的汽车,并打印一条消息,如"Let me see if I can find you a Subaru". ''' print ...

最新文章

  1. php各种编码集详解和在什么情况下进行使用 [php 字符集 显示]
  2. 存储过程---角色权限叠加
  3. Linux中文件上传使用rz
  4. 信息展示类图表设计指南:10个必须遵循的步骤
  5. 老婆怀孕记录以及如何照顾老婆总结
  6. Android WIFI连接开发 WIFI工具类
  7. C语言各数据类型所占内存空间大小
  8. 软件测试中的版本控制
  9. 超出本地计算机网络,超出本地计算机网络适配器卡的名称限制怎么解决?
  10. hive函数中的operators, UDF, UDAF, UDTF, PTF
  11. C++后台开发面试常考
  12. Keil_V5 MDK编译时出现:关于core_cm3.c的错误
  13. 服务器安装系统要如何载入驱动程序,Dell 服务器安装Windows 2008 R2时手动加载阵列卡驱动...
  14. matlab里面box on啥意思,image – Matlab图片中的Box on和axis坐标
  15. 2016依然会给我惊喜,谢谢
  16. Web前端面试指导 四十 CSS3有哪些新特性
  17. 实战大项目:模拟登录丁香园,并抓取论坛页面所有的人员基本信息与回复帖子内容----爬取第二步
  18. spark文本处理-文章分类
  19. 三年级下册计算机全册教案,小学三年级下册信息技术教案三篇
  20. SQLServer的链接服务器

热门文章

  1. ubuntu安装vasp_VASP 软件在ubuntu10.04下的安装过程
  2. 门店销售系统开发实例
  3. 苹果鼠标滚轮驱动_双飞燕血手幽灵V8M Max电竞鼠标兼具功能和性价比
  4. 服务器挂软件系统,云服务器挂软件用什么系统
  5. Maven经验分享(一)安装部署
  6. 【揭秘】中国四大银行的大数据应用已到了哪个阶段?
  7. node中封装MongoDB
  8. 64位window 7安装2TB以上大容量硬盘
  9. Linux chmod文件授权命令
  10. VC++ 各个版本(2005 2008 2010 2012 2013 2015 2017)的运行库下载