今日头条的个性化推荐
一、今日头条个性化推荐流程
服务器1000台,代码实现爬虫功能,在其他传媒网站和门户上抓取各种信息,如果在网站上抓取到纸媒内容,则优先从纸媒门户上抓取信息;抓取信息后,对有价值信息进行分析归类;推送到有感兴趣的头条客户端;用户注册或登录时,通过数据挖掘分析,推荐感兴趣的信息;推送后根据用户体验(阅读时间、评论)判断信息是否符合客户需求,再进一步调整推送信息内容;敏感信息审查;页面转码(对纸媒或网站信息-附带大量广告或样式信息)转码后保存内容资源,格式更适合阅读
聚合媒体除了汇聚来自不同媒体的内容外,更重要的是对不同信息进行分类排序,得到一个信息汇总界面
二、推荐算法的基础-构造相似性矩阵
相似性矩阵可是物与物间的相似性,如书籍间的相似性、音乐间的相似性,基于物品的协同过滤算法可利用用户的历史行为,因而推荐结果具有较强解释性。基于物品的协同过滤算法主要分为两步:1.计算物品之间的相似度,2.根据用户的历史行为生成用户推荐列表
三、基于物品的CF举例
假设有四个用户:用户1在今日头条的浏览记录是[a、b、d];用户2的浏览记录是[b、c];用户3的浏览记录是[c、d];用户4的浏览记录是[b、c、d];可将这四个人的浏览行为表达为以下四个物品矩阵:
用户1 |
用户3 |
||||||||
a |
b |
c |
d |
a |
b |
c |
d |
||
a |
1 |
1 |
a |
||||||
b |
1 |
1 |
b |
||||||
c |
c |
1 |
|||||||
d |
1 |
1 |
d |
1 |
|||||
用户2 |
用户4 |
||||||||
a |
b |
c |
d |
a |
b |
c |
d |
||
a |
a |
||||||||
b |
1 |
b |
1 |
1 |
|||||
c |
1 |
c |
1 |
1 |
|||||
d |
d |
1 |
1 |
将个体用户的物品矩阵相加,汇总成总矩阵M,M[i][j]表示i,j物品被多个用户同时选取的个数(个数越多,则i,j相似性更高)。基于物品间的相似度,如果有一个新用户进入系统,并且他阅读了新闻c(trigger item集合),那么ItemCF算法可以很快给出与新闻c相似度最高的新闻(b和d),并推荐给这个新用户。在推荐过程中,推荐系统可根据用户行为不断优化相似矩阵,或用户可手动对每个新闻的兴趣标出
a |
b |
c |
d |
|
a |
1 |
1 |
||
b |
1 |
2 |
2 |
|
c |
2 |
2 |
||
d |
1 |
2 |
2 |
这两个表格是今日头条热点新闻及个人定制新闻基础原理,分两步:1.先找出新闻之间的热点与相似度,2.将热点及相似度高的新闻推送给用户
假设在抗战胜利70周年当天,有4个人同时浏览今日头条的新闻:
A是女读者,她点击秋季糖水制作方法、育儿应注意的五个事项、阅兵式、新型武器等新闻
B是中年上班族,他点击了阅兵式、中国最新兵器谱等新闻
C是一位年长者,他点击了养生、阅兵式、新型武器等新闻
D是一位刚毕业的男大学生,他点击了英雄联盟攻略、好莱坞旅行攻略、阅兵式、新型武器等新闻
热点和相似度的产生过程:
STEP 1:四个人同时点击阅兵式和新型武器,系统算法就会通过点击和停留时间计算出阅兵式和新型武器是当天热点
STEP 2:阅兵式和新型武器同时被多人点击,代表他们之间具有相似性
STEP 3:当新进用户点击新闻时,今日头条会以最快速度分析他点击的内容,并在已经排查出的热点新闻中寻找他所感兴趣的相关内容匹配,引导阅读热点
今日头条的个性化推荐相关推荐
- 今日头条的个性化推荐算法
互联网给用户带来了大量的信息,满足了用户在信息时代对信息的需求,但也使得用户在面 对大量信息时无法从中获得对自己真正有用的那部分信息,对信息的使用效率反而降低了, 而通常解决这个问题最常规的办法是推荐 ...
- 今日头条核心技术“个性推荐算法”揭秘
今日头条核心技术"个性推荐算法"揭秘 最近面试华兴资本, 他们比较关注今日头条算法的实现, 今天特转载网上 今日头条算法解密 [IT168 评论]互联网给用户带来了大量的信息,满足 ...
- 今日头条的文章推荐机制是什么?
今日头条的文章推荐机制是什么? 木木博客2015-03-28 11:15:54阅读(3982)评论(3)分享到 众所周知,今日头条是个个性化的新闻推荐引擎,在短短两年多的时间内拥有了2.2亿用户,每天 ...
- 今日头条的排名算法_今日头条核心技术“个性推荐算法”揭秘
[IT168 评论]互联网给用户带来了大量的信息,满足了用户在信息时代对信息的需求,也使得用户在面对大量信息时无法从中获得对自己真正有用的那部分信息,对信息的使用效率反而降低了,而通常解决这个问题最常 ...
- 深度解密今日头条的个性化资讯推荐技术
资讯产品近几年持续火爆,赚足了人们的眼球.以今日头条披露的数据为例:日活跃用户超过一亿,单用户日均使用时长超过 76分钟,资讯类产品的火爆程度可见一斑.资讯类产品的火爆让BAT巨头坐卧不安,纷纷站出来 ...
- 用今日头条的方法推荐公开课
做了个APP,名字很土,叫<学啥>.用今日头条的方法推荐公开课.服务端是阿里云CentOS7+Play!+Scala+Docker+Appache Mahout, 爬虫是Scrapy,做了 ...
- 今日头条的新闻推荐算法原理
转自: http://www.sohu.com/a/217514835_488163 信息越来越海量,用户获取信息越来越茫然,而推荐算法则能有助于更好的匹配海量内容和用户需求,使之更加的"有 ...
- 【干货】今日头条的新闻推荐算法原理
信息越来越海量,用户获取信息越来越茫然,而推荐算法则能有助于更好的匹配海量内容和用户需求,使之更加的"有的放矢" .为让产业各方更好的了解算法分发的相关技术和原理,我们特整理了当下 ...
- 今日头条网页版推荐流及信息流_signature
上了直接搜_signature就ok,最后一个就是,进去后打上断点. 断点一打清晰明了. 找到I函数,再次打断点,验证位置没找错,接下来就是分析函数扣函数了. window = global; var ...
- 广告主选择在今日头条推广的优势有哪些?头条搜索广告怎么做?
今日头条基于个性化推荐引擎技术,让优质丰富的信息得到高效精准的分发,转化率高,小编现在就详细为大家介绍在今日头条做推广优势有什么?头条搜索广告怎么做? 今日头条推广的优势 1.流量资源多 据统计,目前 ...
最新文章
- Java 2实用教程(第五版)耿祥义 全部课后习题答案
- ANTLR 4的C#实例
- Mac上更新Ruby
- C++初始编程及相关的问题总结
- react 交互_如何在React应用程序中跟踪用户交互
- C#笔记(五):文件和流
- 太真实了!工业界AI项目落地血泪教训总结
- Android binder
- 对《Java编程思想》读者的一点建议
- 文件格式、后缀名、图片格式详解
- KEIL4烧写下载程序到STM32最小系统板
- 微服务整合J2cache并改造使用
- 行驶证核验-行驶证核验查询-行驶证核验接口-行驶证核验查询接口-行驶证核验api接口-行驶证核验api
- 使用Xamarin实现跨平台移动应用开发(转载)
- 苹果公布Apple Watch手表新专利,可穿戴设备少不了Find My技术
- PDF转Word怎么转?教你三招快速实现PDF转Word
- 计算机考试照片识别,PS照片JPEGsnoop帮你鉴别
- 公众无线局域网体系结构和运营模式
- 4级网络工程师真题第4套知识点
- 有了它,你也能练出马甲线