(一)什么是信息流产品

当下,信息流(资讯)和短视频是唯一两个在用户领域保持好的增长事态的细分行业。像其他比较成熟的互联网细分行业,比如说移动社交,电商,OTO这个细分行业,用户已经饱和了,用户增长比较缓慢,而短视频以及信息流是一个很迅猛的用户增长的势头。

信息流产品是一个非常好的用作商业变现的产品形态。

1. 信息流产品的特点

  • 信息流产品

    • 在合适的场景下,为用户提供合适的内容
    • 适合手机屏幕,手指上下滑动,如水流般源源不断
    • 数据量足够大,能够不断刷出新内容

2. 对用户价值

从用户层面讲,信息流产品对于用户价值,主要体现在下面四个方面

  • 便捷阅读

    • 相对于传统的书籍,杂志,信息流产品会是一个便捷的阅读方式
  • 海量信息

  • 新鲜及时

  • 个人兴趣

3. 商业上的价值

商业上的价值就是信息流广告
信息流广告是一种很高效的变现模式

  • 就像曾经的搜索广告,信息流广告已经成为用户接受的、高效变现模式

今日头条 DAU(日活)超过1.2 亿,人均时长70分钟+,年均广告营收150亿+;
网易DAU超过2千万,人均时长40分钟+,年均广告营收50亿+;

(二)如何推荐内容

信息流产品的本质是推荐内容,那怎么样推荐内容呢?

1. 推荐内容的两种方法

一种是人工运营的方法,人工去筛选一套人工的经验去对新闻价值做出判断;另外一种就是依靠机器,依靠算法去做推荐,这两种推荐内容的方法各有优劣。

2.为什么要用算法

大数据时代,每天更新的内容是海量的。而人工运营,往往局限于热点内容,就像是冰山一角。冰山之下,是大量的长尾、冷门的内容,必须依赖机器算法做个性化推荐。

3. 推荐系统框架

  • 理论上的简化框架
  • 推荐系统实操

    我们会有合作伙伴(Partner),也会有爬虫(Crawler),我们通过爬虫或者是合作伙伴会把我们的数据抓到我们的库里,大概库里每天文章的更新会在 20 万左右,文章入库之后,我们通过 Content Parser(分词提取器)会对文章做一些语义分析、文本分析去生成一些文章相关的标签或者类型等一些特征,通过过滤之后,我们会把这些数据放在 Feeder 的数据库。Feeder 一方面与这个Feature Server 相交互,会把数据传递到 index(用户兴趣索引)。用户会根据会话的行为,会做一些记录和上报,同时会把这些数据(Session Server)同步更新到用户索引上。Index 之后的召回(Recall),对于一个用户来讲,我们第一次召回,会召回 2000 篇文章左右。这 2000 篇文章的来源一个是CF(协同过滤) ,CF又来源于 ItemCF 就是基于内容的相似度(我之前看过一篇文章,我会推一个跟之前文章相似的文章,就是基于文章相似度做一个推荐),UserCF就是基于用户相似度的协同过滤,就是通过计算,找出用户跟另外一个人类似,然后就会把另一个人看过的文章和感兴趣的内容也推给这个用户。另外还有一种召回内容的方式叫 CB 就是基于内容本身,比如说这篇文章是体育,那这篇文章就会推送给有体育标签的用户。比如说一篇文章有关键字,有科比,那就会推荐给带有科比标签的用户。NH 就是在当前系统里比较热门的文章,那我们怎么判断那些是热门的文章呢,首先是依据 action 就是行为,因为每篇文章可以会被用户阅读,被用户点赞,被用户评论,被用户分享,我们还会制定一些权重,那我们对这些行为做一个分析,我们可以判断这个文章是一个热门文章。那我们这些热门文章在召回的时候,也会基于 User Profile(用户属性)比如说性别属性、地区属性等,我们也不会乱推,尽管它是热门文章,我们也要考虑人群的定向化;Time 就是任何热门的东西,都有时间衰减性。
    下面说 Rank 这个模块,就是排序的模块。这个模块我们会说从刚刚 2000 篇的文章里筛选出 200 篇文章,并且对这 200 篇文章进行排序。那我们这 200 篇文章是怎么排序的呢?我们会对这 200 篇文章进行 CTR 的预估,以及阅读时长的预估。为什么不只做 CTR 的预估,就是系统要避免“标题档”的存在。从这200篇文章里,最后到 Rerank 的模块,就是从 200 篇文章里审出 15 篇文章。我们用贝叶斯的方法对这个15篇,主要要增加文章的多样性,我们要把同类推荐的文章打散;Fix 就是在这15 篇文章里增加探索性的内容,我们不希望让用户的标签固化,就是一个用户打上了体育标签,我们不希望这个用户永远会是这个标签,我们偶尔也会加 5%-10% 左右的探索性的内容。

(三)推荐质量的评估

1. 流量该如何分配

  • 70% 的流量分配给稳定模型

  • 30% 的流量分配给实验模型

    • 10% 实验模型A
    • 10% 实验模型B
    • 10% 实验模型C

2. 实验模型的评测指标

  • 准确率

    • 推荐列表里,多少比例的文章,是用户读过的;
  • 召回率

    • 推荐列表中,用户度过的文章,占用户阅读记录的比例
  • 覆盖率

    • 推荐列表的文章里,占文章总数的比例

举例:文章总量为100,用户实际看了10篇文章,最终实验模型推荐了20篇文章,用户看过的有8篇,准确率为40%,召回率为80%,覆盖率为20%;

3. 实际业务中关注的算法效果

  • UV 转化率

    • 阅读UV/曝光UV,反映多少比例的曝光用户转化为阅读用户
  • PV 转化率

    • 阅读PV/曝光PV,反映文章的平均转化情况
  • 人均篇数

    • 阅读PV/阅读UV,反映内容消费深度
  • 人均阅读时长

    • 阅读总时长/阅读UV,反映内容消费深度

信息流产品和内容推荐算法相关推荐

  1. 基于内容推荐算法实现原理

    本文会从什么是基于内容的推荐算法.算法基本原理.应用场景.基于内容的推荐算法的优缺点.算法落地需要关注的点等5个方面来讲解. 1.什么是基于内容的推荐算法 所谓基于内容的推荐算法(Content-Ba ...

  2. 如何使用Spring+SpringMVC+Mybatis开发实现个性化小说推荐系统 协同过滤推荐算法实现 基于用户、项目的协同过滤推荐 基于聚类、关联规则、内容推荐算法 WebNovelCFRS

    如何使用Spring+SpringMVC+Mybatis开发实现个性化小说推荐系统 协同过滤推荐算法实现 基于用户.项目的协同过滤推荐 基于聚类.关联规则.内容推荐算法 WebNovelCFRS 一. ...

  3. 基于机器学习的内容推荐算法及其心理学、社会学影响闲谈

    基于机器学习的内容推荐算法目前在各类内容类APP中使用的非常普遍.在购物.时尚.新闻咨询.学习等领域,根据用户的喜好,进行较为精准的用户画像与内容推荐.此类算法不但可以较为准确的分析用户的特征,如年龄 ...

  4. 基于内容推荐算法的电影推荐系统

    基于内容的推荐算法 格局用户过去一段时间内喜欢的物品,以及由此推算出来用户偏好,为用户推荐相似物品.其中的"内容"指的便是:用户过去一段时间内喜欢的物品,以及由此推算出来的用户偏好 ...

  5. 协同过滤推荐算法和基于内容推荐算法的区别?

    文章最前: 我是Octopus,这个名字来源于我的中文名--章鱼:我热爱编程.热爱算法.热爱开源.所有源码在我的个人github :这博客是记录我学习的点点滴滴,如果您对 Python.Java.AI ...

  6. 内容推荐算法简单实现(余弦公式)

    内容推荐算法简单实现(针对阅读网站为用户推荐书籍) 目标是最终获取一个书籍/类型的表格(二维),一个某用户对于每个类型的评分(该评分是处理过的,具体见"注")表格(一维).现在取出 ...

  7. 全面揭秘快手与抖音的内容推荐算法

    快抖的视频内容分为推荐(发现).附近(同城)和关注三个模块,这里主要说明推荐模块的算法机制. 视频与用户画像的匹配程度 热度(赞.评论.转发等) 发布时间 根据用户数据和内容标签计算两者的匹配程度,是 ...

  8. 基于内容推荐算法html,基于内容的互联网推荐算法

    摘 要 本文介B了网络推荐的算法思想.帮助读者了解这个研究领域.在介绍了推荐系统的概念和定义之后,重点介绍了基于内容的互联网推荐算法. 关键词 推荐系统 推荐算法 互联网 中图分类号:TP391.3 ...

  9. 机器学习模型 知乎_算法有没有价值观?知乎内容推荐算法解析

    [IT168 技术]今年,我们已经听到了多家内容平台整改的消息,对于标题党.蹭热点等行为,用户早已经见怪不怪.同样是知识分享平台,知乎倒是躲过了每一次整改,肯定有人会说是幸运,也肯定有人会从理性的角度 ...

最新文章

  1. 写一个操作系统有多难?自制 os 极简教程
  2. 值得期待的.Net Micro Framework 3.0
  3. 关于GPU-driver for linux的资料
  4. openoffice 安装后中文字符乱码问题
  5. 你好,脂肪肝!来自22岁的大学生的体检报告
  6. Scanner读取一个int数组
  7. 单片机里面的CPU使用率是什么鬼?
  8. 『性能测试』文章大汇总
  9. 开发的必杀技:Git 的分支管理
  10. html5与其他语言的优势,浅谈:html5和html的区别
  11. EurekaServer高可用的注册中心集群搭建
  12. linux yum安装python3_linux下yum安装python3
  13. 简单的springBoot集成jedis
  14. win98装python_Windows 上的 Python安装
  15. 【算法竞赛入门经典(第二版)】_要点提取(第三章)
  16. PLC 控制柜常用电气元件整理表
  17. SPSS 中介效应检验(图文+数据集)【SPSS 043期】
  18. Latex 制作表格
  19. 老师用计算机教我们画画拼音,《ang eng ing ong》教案
  20. NUBT 1480 懒惰的风纪委Elaine

热门文章

  1. 基于COMSOL多物理场耦合仿真建模方法研究
  2. android webview优酷,android 使用WebView 支持播放优酷视频,土豆视频
  3. 英语钻石法则(二)------没必要专门的学习语法
  4. GoLang 使用 RabbitMQ 优先级队列
  5. java 拦截手机验证码_华为手机这个设置能防范APP偷读你的短信验证码
  6. (原创)[短小精悍系列]为什么生活中黄色物品给人感觉较亮,而蓝色物品给人感觉较深?其实你只看到了表象
  7. 29岁转行程序员?别想了、没戏?难道现实真就如此残酷?
  8. JAVA求两点间的距离:
  9. 在Wince下如何实现数据存储到数据库中
  10. 绝对值得收藏的十位电影配乐大师 (下)