目录

0. 相关文章链接

1. 什么是基于内容的推荐算法

2. 基于内容的推荐算法举例

3. 基于内容的推荐算法总结

4. 相似度计算

5. 基于内容推荐系统的高层次结构

6. 基于UGC的推荐

7. 基于UGC简单推荐的问题

8. 基于TF-IDF的推荐

9. TF-IDF对基于UGC推荐的改进


0. 相关文章链接

推荐系统文章汇总

1. 什么是基于内容的推荐算法

Content-based Recommendations (CB)根据用户过去喜欢的产品(本文统称为item),为用户推荐和他过去喜欢的产品相似的产品。该相似度不是通过ItemCF进行实现,而是通过抽取物品内在或者外在的特征值,实现相似度计算。

比如一个电影,有导演、演员、用户标签UGC、用户评论、时长、风格等等,都可以算是特征。可以表示为特征向量: V = [导演,演员,用户标签UGC,用户评论,时长,风格],多个电影不就是多个向量么!向量之间可以求相似度。

  • //V1 = [张艺谋,巩俐,剧情,好看,90分钟,中国风,红高粱]
  • //V2 = [张艺谋,巩俐,剧情,好看,90分钟,中国风,xxx]

基于内容的推荐算法,原理是用户喜欢和自己关注过的Item在内容上类似的Item,比如你看了哈利波特I,基于内容的推荐算法发现哈利波特II,与你以前观看的在内容上面(共有很多关键词)有很大关联性,就把后者推荐给你。一般来说, 物品都有一些关于内容的分类,例如书籍有科技、人文、工具等分类,电影有战争、爱情、喜剧等分类,商品有食物、衣物、家电等分类。

而基于内容的推荐,就是根据这些物品的内容属性和用户历史评分或操作记录,计算出用户对不同内容属性的爱好程度,再根据这些爱好推荐其他相同属性的物品。

基于内容的推荐系统本质是对Item内容进行分析,建立特征,然后基于用户对何种特征的内容感兴趣以及分析一个Item具备什么特征来进行推荐。

2. 基于内容的推荐算法举例

用户A 对《银河护卫队》《变形金刚》《星际迷航》三部科幻电影都有评分,平均分为4 .7 分( ( 5+4+5 ) / 3=4.7 );对《三生三世》《美人鱼》《北京遇上西雅图》三部爱情电影评分平均分为2.3 分( ( 3 十2+2 ) /3= 2.3 )。

那么很明显, 用户A 对科幻电影有明显的偏好。当推荐系统预测用户A 在《独立日》上的评分时,可以用A 在所有科幻电影上的平均分4.7 分替换;类似地,可以预测用户A 在《七月与安生》的评分为2 . 3 分,因此推荐系统优先将《独立日》推荐给用户A 。

而对于用户B ,在爱情电影上平均分更高,故而推荐系统会将《三生三世》推荐给用户B 。

实际上,在很多视频APP 中,都有类似的基于内容的推荐方法。

3. 基于内容的推荐算法总结

基于内容的推荐算法介绍一:

  • Content-based Recommendations (CB)根据推荐物品或内容的元数据,发现物品的相关性,再基于用户过去的喜好记录,为用户推荐相似的物品。
  • 通过抽取物品内在或者外在的特征值,实现相似度计算。
    • 比如一个电影,有导演、演员、用户标签 UGC 、用户评论、时长、风格等等,都可以算是特征。
  • 将用户(user)个人信息的特征(基于喜好记录或是预设兴趣标签),和物品(item)的特征相匹配,就能得到用户对物品感兴趣的程度
    • 在一些电影、音乐、图书的社交网站有很成功的应用,有些网站还请专业的人员对物品进行基因编码/打标签(PGC)

基于内容的推荐算法介绍二:

  • 对于物品的特征提取 - 打标签(tag)

    • 专家标签(PGC)
    • 用户自定义标签(UGC)
    • 降维分析数据,提取隐语义标签(LFM)
  • 对于文本信息的特征提取 - 关键词
    • 分词、语议处理和情感分析(NLP)
    • 潜在语义分析(LSA)

4. 相似度计算

  • 相似度的评判,可以用距离表示,而一般更常用的是“余弦相似度”
  • 欧氏距离

  • 余弦相似度

  • 如下图所示( dist(A,B)为欧氏距离,为余弦相似度 ):

5. 基于内容推荐系统的高层次结构

6. 基于UGC的推荐

7. 基于UGC简单推荐的问题

8. 基于TF-IDF的推荐

9. TF-IDF对基于UGC推荐的改进


注:其他推荐系统相关文章链接由此进 -> 推荐系统文章汇总


推荐系统(6):推荐算法之基于内容的推荐算法相关推荐

  1. 推荐算法概述(基于用户的协同过滤算法、基于物品的协同过滤算法、基于内容的推荐算法)

    "无意中发现了一个巨牛的人工智能教程,忍不住分享一下给大家.教程不仅是零基础,通俗易懂,而且非常风趣幽默,像看小说一样!觉得太牛了,所以分享给大家.点这里可以跳转到教程." 目前推 ...

  2. 推荐系统实战(5)——基于内容的推荐算法(CB)

    1 基础CB推荐算法 基础CB推荐算法利用物品的基本信息和用户偏好内容的相似性进行物品推荐.通过分析用户已经浏览过的物品内容,生成用户的偏好内容,然后推荐与用户感兴趣的物品内容相似度高的其他物品. 比 ...

  3. 经典推荐算法(基于内容的推荐算法)

    基于内容的推荐算法(Content-Based Recommendations,CB)是一种经典推荐算法,一般只依赖于用户及物品自身的内容属性和行为属性,而不涉及其他用户 的行为,在 冷启动 的情况下 ...

  4. 推荐常用算法之-基于内容的推荐(转自-BreezeDeus博主)

    Collaborative Filtering Recommendations (协同过滤,简称CF) 是目前最流行的推荐方法,在研究界和工业界得到大量使用.但是,工业界真正使用的系统一般都不会只有C ...

  5. 推荐常用算法之-基于内容的推荐

    Collaborative Filtering Recommendations (协同过滤,简称CF) 是目前最流行的推荐方法,在研究界和工业界得到大量使用.但是,工业界真正使用的系统一般都不会只有C ...

  6. 一文全面了解基于内容的推荐算法

    作者丨gongyouliu 来源 | 转载自大数据与人工智能(ID:ai-big-data) 这篇文章我们主要关注的是基于内容的推荐算法,它也是非常通用的一类推荐算法,在工业界有大量的应用案例. 本文 ...

  7. 推荐系统_基于内容的推荐

    关于推荐系统的算法大概可以分类两类: 一类就是基于用户或者基于商品的协同过滤,我们主要是通过用户行为这个海量数据来挖掘出用户在品味上的一些相似程度,或者说 商品的相似程度,然后我们在利用相似性来进行推 ...

  8. 一文看懂基于内容的推荐算法

    作者 | gongyouliu 来源 | 数据与智能 从本篇开始我们来详细讲解各类推荐算法.这篇文章我们主要关注的是基于内容的推荐算法,它也是非常通用的一类推荐算法,在工业界有大量的应用案例. 本文会 ...

  9. 推荐算法(一)—— 基于内容的推荐算法

    推荐算法(一)--  基于内容的推荐算法 1 基于内容的推荐算法 基于内容的推荐系统本质是对内容进行分析,建立特征:基于用户对何种特征的内容感兴趣以及分析一个内容具备什么特征来进行推荐. 1.1 基于 ...

  10. 常用的基于内容的推荐算法实现原理

    这篇文章我们主要关注的是基于内容的推荐算法,它也是非常通用的一类推荐算法,在工业界有大量的应用案例. 本文会从什么是基于内容的推荐算法.算法基本原理.应用场景.基于内容的推荐算法的优缺点.算法落地需要 ...

最新文章

  1. 在线作图|在线做UMAP降维分析
  2. c++中内敛函数_C++ 内联函数 | 菜鸟教程
  3. python库迁移到没有网的电脑_关于换机器后python库的迁移-偷懒做法
  4. 虚拟机环境下安装ESX不能安装虚拟系统解决方案
  5. web api添加拦截器
  6. Asp.Net访问Oracle 数据库 执行SQL语句和调用存储过程
  7. 为何你仍是一名社畜码农?
  8. RuntimeError: output with shape [4, 1, 512, 512] doesn‘t match the broadcast shape[4, 4, 512, 512]
  9. 国家电网考试计算机基础知识,大学计算机基础(国家电网考试整理)
  10. 学生管理-axios优化
  11. 【PC】小米路由器Pro(R3P)升级/刷机
  12. passenger+nginx框架部署
  13. Multisim设置图纸大小的详细步骤
  14. 学java怎么做兼职?学Java什么程度才能找兼职?
  15. 国产开源项目管理软件ZenTao
  16. 小米 未检测到任何互联网连接 因此不会自动重新连接
  17. 【转】PHP PDO 学习笔记
  18. 剑指offer每日六题---------day five
  19. 【盲信道估计】基于matlab的LMS盲信道估计QPSK仿真
  20. 阿里巴巴Android开发手册

热门文章

  1. 中国电信-应招知识库(专业知识)
  2. 信用卡分期年化利率计算方法
  3. 淘宝美工设计师细说何为天猫透明背景
  4. vs2015开发在网页中调用的ocx控件详解(一)
  5. Java短信验证码-互亿无线
  6. 串口服务器虚拟串口失败,串口服务器常见问题
  7. 搞定INTEL快速存储技术(用SSD硬盘做缓存加速)
  8. spring boot生成Excel表格 导出/导入
  9. 持久化配置管理 diamond 使用简介
  10. arm+linux书籍