PMCAFF(www.pmcaff.com):互联网产品社区,是百度,腾讯,阿里等产品经理的学习交流平台。定期出品深度产品观察,互联产品研究首选。

外包大师(www.waibaodashi.com)要外包,找大师。PMCAFF旗下高质量互联网外包解决方案提供商。外包大师服务号:waibaodashi365

作者:卢争超 PMCAFF会员 前UC海外产品运营经理,前微信支付海外产品经理,负责UC浏览器、微信支付等产品的国际化。

今日头条的走红带动了“个性化推荐”的概念,自此之后,内容型的产品,个性化算法就逐渐从卖点变为标配。

伴随着“机器学习”,“大数据”之类的热词和概念,产品的档次瞬间提高了很多。而各种推荐算法绝不仅仅是研发自己的任务,作为产品经理,必须深入到算法内部,参与算法的设计,以及结合内容对算法不断“调教”,才能让产品的推荐算法不断完善,最终与自己的内容双剑合璧。

本文以新闻产品为例,结合了我之前产品从零积累用户的经验,整理了作为PM需要了解的基本算法知识和实操。

算法的发展阶段

个性化推荐不是产品首次发布时就能带的,无论是基于用户行为的个性化,还是基于内容相似度的个性化,都建立在大量的用户数和内容的基础上。产品发布之初,一般两边的数据都有残缺,因此个性化推荐也无法开展。

所以在产品发展的初期,推荐内容一般采用更加聚合的“热度算法”,顾名思义就是把热点的内容优先推荐给用户。虽然无法做到基于兴趣和习惯为每一个用户做到精准化的推荐,但能覆盖到大部分的内容需求,而且启动成本比个性化推荐算法低太多。

因此内容型产品,推荐在发布初期用热度算法实现冷启动,积累了一定量级以后,才能逐渐开展个性化推荐算法。

热度算法

1、热度算法基本原理

需要了解的是,热度算法也是需要不断优化去完善的,基本原理:

新闻热度分 = 初始热度分 + 用户交互产生的热度分 – 随时间衰减的热度分

Score = S0 + S(Users) – S(Time)

新闻入库后,系统为之赋予一个初始热度值,该新闻就进入了推荐列表进行排序;随着新闻不断被用户点击阅读,收藏,分享等,这些用户行为被视作帮助新闻提升热度,系统需要为每一种新闻赋予热度值;同时,新闻是有较强时效性的内容,因此新闻发布之后,热度必须随着新闻变得陈旧而衰减。

新闻的热度就在这些算法的综合作用下不断变化,推荐列表的排序也就不断变化。

2、初始热度不应该一致

上面的算法为每一条入库的新闻赋予了同样的热度值,但在现实使用后发现行不通,例如娱乐类别比文化类别受欢迎程度本身就高很多;或者突发了严重的灾害或事故;或是奥运会期间,体育类别的关注度突然高了起来;而此时如果还是每条新闻给同样的热度就不能贴合实际了。

解决办法就是把初始热度设置为变量:

(1)按照新闻类别给予新闻不同的初始热度,让用户关注度高的类别获得更高的初始热度分,从而获得更多的曝光。

例如:

(2)对于重大事件的报道,如何让它入库时就有更高的热度,我们采用的是热词匹配的方式。

即对大型新闻站点的头条,Twitter热点,竞品的头条做监控和扒取,并将这批新闻的关键词维护到热词库并保持更新;每条新闻入库的时候,让新闻的关键词去匹配热词库,匹配度越高,就有越高的初始热度分。

这样处理后,重大事件发生时,Twitter和门户网站的争相报道会导致热词集中化,所有匹配到这些热词的新闻,即报道同样事件的新闻,会获得很高的初始热度分。

3、用户行为分规则不是固定不变的

解决了新闻入库的初始分之后,接下来是新闻热度分的变化。先要明确用户的的哪些行为会提高新闻的热度值,然后对这些行为赋予一定的得分规则。

例如对于单条新闻,用户可以点击阅读(click),收藏(favor),分享(share),评论(comment)这四种行为,我们为不同的行为赋予分数,就能得到新闻的实时用户行为分为:

S(Users) = 1*click + 5*favor + 10*comment + 20*share

这里对不同行为赋予的分数为1,5,10,20,但这个值不能是一成不变的;当用户规模小的时候,各项事件都小,此时需要提高每个事件的行为分来提升用户行为的影响力;当用户规模变大时,行为分也应该慢慢降低,因此做内容运营时,应该对行为分不断调整。

当然也有偷懒的办法,那就是把用户规模考虑进去,算固定用户数的行为分,即:

S(Users) = (1*click + 5*favor + 10*comment + 20*share)/ DAU * N(固定数)

这样就保证了在不同用户规模下,用户行为产生的行为分基本稳定。

4、热度随时间的衰减不是线性的

由于新闻的强时效性,已经发布的新闻的热度值必须随着时间流逝而衰减,并且趋势应该是衰减越来越快,直至趋近于零热度。换句话说,如果一条新闻要一直处于很靠前的位置,随着时间的推移它必须要有越来越多的用户来维持。

我们要求推荐给用户的新闻必须是24h以内,所以理论上讲,衰减算法必须保证在24h后新闻的热度一定会衰减到很低,如果是线性衰减,当某些新闻突然有大量用户阅读,获得很高的热度分时,可能会持续排名靠前很久,让用户觉得内容更新过慢。

参考牛顿冷却定律,时间衰减因子应该是一个类似于指数函数:

T(Time) = e ^ (k*(T1 – T0)) 

其中T0是新闻发布时间,T1是当前时间。

而由于热度的发展最终是一个无限趋近于零热度的结果,最终的新闻的热度算法也调整为:

Score = ( S0(Type) + S(Users)) / T(Time)

5、其他影响因素

很多新闻产品会给用户“赞”,“踩”或“不在推荐此类”的选项,这些功能不仅适用于个性化推荐,对热度算法也有一定的作用。

新闻的推送会造成大量的打开,在计算热度的时候需要排除掉相关的影响。类似于这样的因素,都会对热度算法产生影响,因此热度算法上线后,依然需要不断地“调教”。

建议把所有的调整指标做成可配项,例如初始热度分,行为事件分,衰减因子等,从而让产品和运营能实时调整和验证效果,达到最佳状态。

基于内容的推荐算法


http://www.taodudu.cc/news/show-546764.html

相关文章:

  • 初创公司根本没数据,增长黑客个屁
  • 做好数据分析必备的 5 种典型可视化图表 | 技能卡片 No.1
  • 浅谈机器人产品落地全过程
  • 持续更新 | PMCAFF问答专场活动分享笔记大合集
  • 从系统设计到市场痛点,浅谈英国自助结账系统
  • 装修行业难互联网化?利润不合理并非本质,体制才是
  • “向前进,向钱进”上:自媒体的流量变现路
  • 程序员到底需要什么样的需求文档?
  • 为什么说“按月订购”和“无人货架”本质上是一样的?
  • 我对香港数字生活的一些观察
  • 长文 | 从发展轨迹、社会变迁和人口数据变化来看工具类产品的发展出路有哪些(1)
  • 如何针对产品销售设计一套有效的奖励和惩罚销售措施?
  • 复盘无人业态的三点心得:起于共享单车,止于何?
  • 一名优秀的初创企业员工怎么做好工作计划
  • 产品经理成长三五事儿:搭建自己的成长模型
  • 一位 CEO 对 CTO 技术领导力的期待是什么?
  • 产品经理的必经之路:搭建属于自己的成长模型
  • 比iPhone8更重要的新App Store,给内容产品的未来指出明路
  • 复盘 | 听全民K歌体验设计师聊聊歌房项目完整设计历程
  • Pinterest 首位产品经理:爆发式增长背后的 5 大经验总结
  • 对 UI 设计师来说,iPhone X 意味着什么?
  • 如何挖掘消费者的隐性需求?
  • 长假后第一天不想工作,这病咋治?
  • 史上最详细的客服系统产品落地|后台产品经理的工作实例,有那么苦吗?
  • 干货整理及PPT下载福利 2017(上海)人工智能产品经理大会
  • 领英全球副总裁:如何做到 5 亿用户增长的 ?
  • 产品策划系列:洞察需求(四)
  • 打造一款安全的互金产品时,需要考虑什么
  • 淘宝双十一用哪些“潜规则”冲击1500亿?
  • 淘宝双十一用5个“潜规则”冲击1500亿

老板说“我们要做个性化推荐”时,你该怎么办......相关推荐

  1. 从0开始做垂直O2O个性化推荐-以58到家美甲为例

    从0开始做垂直O2O个性化推荐 上次以58转转为例,介绍了如何从0开始如何做互联网推荐产品(回复"推荐"阅读),58转转的宝贝为闲置物品,品类多种多样,要做统一的宝贝画像比较难,而 ...

  2. 双11个性化推荐背后,阿里云“舜天”如何应对百亿次挑战?

    摘要: 2018天猫双11在技术世界,创下不少新记录,其中有一个记录是11日当天阿里全平台共为用户做个性化推荐453亿次,这些推荐的图片长度加起来可以绕地球70圈. 当你在天猫/手淘上买买买的时,图片 ...

  3. 个性化推荐之召回的方法

    在这个信息爆炸的时代,每个人都是内容的消费者,也轻而易举地可以成为内容的创造者.在海量的信息中,用户找到所需.所想.所爱的优质内容变得异常困难,个性化推荐也因此应运而生. 个性化推荐是在大数据分析和人 ...

  4. 双11个性化推荐背后,阿里云“舜天”如何应对百亿次挑战? 1

    2018天猫双11在技术世界,创下不少新记录,其中有一个记录是11日当天阿里全平台共为用户做个性化推荐453亿次,这些推荐的图片长度加起来可以绕地球70圈. 当你在天猫/手淘上买买买的时,图片会以不同 ...

  5. 个性化推荐的另一种思路: 学习用户行为的解纠缠表示

    嘿,记得给"机器学习与推荐算法"添加星标 本文是达摩院的研究人员借助VAE系解纠缠方法,对用户在推荐系统场景下的深层认知进行建模的探索.本文涉及不少VAE系解纠缠的前置知识,在这篇 ...

  6. 网易云课堂个性化推荐实践与思考

    作者/ 韩虹莹 编辑/ Ein 从人和信息的博弈谈推荐系统缘起 首先谈谈我理解的推荐系统. 如果说推荐系统的定义是什么,每本书每篇文章说的都不太一样,协同过滤1992年就已经有了,三十年里无数大佬分析 ...

  7. 淘宝如何做到懂你的推荐的?揭秘千人千面个性化推荐原理!

    点击"开发者技术前线",选择"星标????" 在看|星标|留言,  真爱 以下内容根据演讲视频以及PPT整理而成. 手淘推荐简介 手淘推荐的快速发展源于2014 ...

  8. 热度算法和个性化推荐

    今日头条的走红带动了"个性化推荐"的概念,自此之后,内容型的产品,个性化算法就逐渐从卖点变为标配.伴随着"机器学习","大数据"之类的热词和 ...

  9. 干货 | 美图个性化推荐的实践与探索

    互联网技术将我们带入了信息爆炸的时代,面对海量的信息,一方面用户难以迅速发现自己感兴趣的信息,另一方面长尾信息得不到曝光.为了解决这些问题,个性化推荐系统应运而生.美图拥有海量用户的同时积累了海量图片 ...

最新文章

  1. Android 10.0系统启动之init进程-[Android取经之路]
  2. centos6 安装 mantisbt-1.2.8 —— (2)【linux】VMware安装CentOS 6.4
  3. Codeforces 264B Good Sequences ★ (分解素因子+DP)
  4. 不同路径—leetcode62
  5. 硬件:固态硬盘SSD的基础知识及安装注意事项!
  6. 欢乐纪中A组莫名其妙赛【2019.6.6】
  7. 数据科学项目_完整的数据科学组合项目
  8. Leetcode--881. 救生艇
  9. hdu 1698 Just a Hook 线段树区间更新
  10. 计算机句法分析的研究现状,计算机理论论文融合语义和句型信息的中文句法分析方法研究与实现...
  11. AC日记——Roma and Poker codeforces 803e
  12. node-amqp 使用fanout发布订阅rabbitmq消息
  13. Java 书籍 Top 10
  14. 原来蒋先生才是中国互联网启蒙第一人!
  15. php opendir(),php之opendir()函数的用法
  16. matlab src,SRC 这是一个利用了稀疏表示方法的MATLAB程序,供大家参考学习。 Special Effects 图形图像处理 256万源代码下载- www.pudn.com...
  17. 深度linux如何安装迅雷,deepin官方论坛-深度科技官网旗下网站
  18. 15.6. footnote 脚注
  19. 据说程序员节 随手记录下matlab的tan和atan(反正切 arctan函数)
  20. 啃完这些资料,我拿到了腾讯,爱奇艺,Kotlin从入门到进阶实战

热门文章

  1. 灵魂拷问,上 Kubernetes 有什么业务价值?
  2. android menu分割线,给 NavigationView 的Menu的分割线 设置高度和颜色
  3. oracle什么是全局锁,深入浅出oracle锁---原理篇
  4. python绘图函数m_python绘图数据m
  5. 为什么一个程序申请的内存有限制_为什么要做自己的小程序商城,做一个要多久?...
  6. 【知识星球】数据集板块重磅发布,海量数据集介绍与下载
  7. 【AI研究院】360无死角认识一下女神的线上美容院-“美图秀秀”
  8. 全球及中国车载扫地机行业销售前景态势与运营盈利分析报告2022版
  9. 中国数据备份一体机产业未来供需状况及投资潜力价值报告2021年版
  10. how to fix error 25007 : loadlibraryshim()