今日头条核心技术“个性推荐算法”揭秘
今日头条核心技术“个性推荐算法”揭秘
【IT168 评论】互联网给用户带来了大量的信息,满足了用户在信息时代对信息的需求,也使得用户在面对大量信息时无法从中获得对自己真正有用的那部分信息,对信息的使用效率反而降低了,而通常解决 1月20日,新生代移动互联网企业今日头条在北京国家会议中心举办了“算数·年度数据发布会”,数据发布会的主题名为“算数”,实际上指的是“算法”与“数据”。
众所周知,今日头条是
那么今日头条是怎么做到为每一个用户按兴趣精准推荐新闻的呢?在发布会上,今日头条的技术副总裁杨震原给我们揭秘了今日头条的个性化推荐核心“算法”。
今日头条的个性化推荐算法原理
如上图,有3篇文章,让3个用户投票(注:这3个用户是一类人,有相同属性(喜好和偏好)),那第4个用户应该被系统推荐的文章是那篇呢?第4个用户与前3个用户都是一类人,答案显 没错,今日头条的个性化推荐算法原理 今日头条是如何来划分人群和文章
搞技术的朋友都知道, 上面那个例子只是很小的人群,但是现实生活中不会有这样小的人群,而且太小的人群通过推荐投票的方式也很难推荐出很精细的内容,只能推荐出一些热门内容,那今日头条是如何来划分人群?
我们假定上图这 根据人群不同维度,我们可以细分到一个合理的力度。特别需要注意的是:在细分的领域里面投票数既不要太多,但也不要太少,因为太多没有个性化,仅是一个大众关心的话题而已,而投票数太少又没有统计意义,支持度就低了。
人群特征可以是阅读姓名,年龄,地域,职业等等。同理,文章也是类似的,文章有提到哪些名人,文章发布的时间,文章所属的地区等等,也都有很多特性,这些都是可以去组合起来。
今日头条是怎样判断一个人属于怎样的人群
判断一个人属于怎样的人群相对简单。比如地域,用户的手机在什么区域,就可以认为用户是什么地域的;比如说用户兴趣,可以根据用户的阅读习惯去判断,用户会经常去看科技的文章,那就可以判断用户属于科技的人群;再比如说用户的好友关系,用户在今日头条上面注册了,用户的好友都是娱乐圈的人,则该用户很有可能也是娱乐圈的人;所以通过用户在今日头条上行为,以及用户客观的地理位置信息,就能判断用户到底属于一个什么样的人群。
今日头条的个性推荐算法公式
精准推荐最难的不是划分人群,也不是判断用户人群归属,更不是文章属性判断,一个人可以属于多个人群,也有多个文章候选,选那个推荐才是最难的。而今日头条的推荐内容是怎么算出来的呢?
通过上图的计算公式:W1*候选1的投票率+W2*候选2的投票率+W3候选3的投票率+……=最高分,最后能计算出一个得分,按得分的高低来排序,就可以得到推荐文章的一个侯选,这个过程实际上是一个比较简单的算法,而这在今日头条内部叫逻辑回归。
总的来说,个性化推荐技术本身并不神秘,归根到底推荐算法关键是还在于对海量用户行为的数据分析与挖掘,也许各家算法略有不同,但最终目的都是殊途同归,为实现最精准的内容推荐而努力中。
如果你看的还不过瘾,欲知更多(阿里、腾讯、网易、58同城、豆瓣等)知名站点推荐系统技术内容,请点击(牛逼站是怎样炼成的?-推荐系统篇)
转载于:https://www.cnblogs.com/ityz/p/6079261.html
今日头条核心技术“个性推荐算法”揭秘相关推荐
- 今日头条的排名算法_今日头条核心技术“个性推荐算法”揭秘
[IT168 评论]互联网给用户带来了大量的信息,满足了用户在信息时代对信息的需求,也使得用户在面对大量信息时无法从中获得对自己真正有用的那部分信息,对信息的使用效率反而降低了,而通常解决这个问题最常 ...
- 今日头条的个性化推荐算法
互联网给用户带来了大量的信息,满足了用户在信息时代对信息的需求,但也使得用户在面 对大量信息时无法从中获得对自己真正有用的那部分信息,对信息的使用效率反而降低了, 而通常解决这个问题最常规的办法是推荐 ...
- 今日头条的新闻推荐算法原理
转自: http://www.sohu.com/a/217514835_488163 信息越来越海量,用户获取信息越来越茫然,而推荐算法则能有助于更好的匹配海量内容和用户需求,使之更加的"有 ...
- 【干货】今日头条的新闻推荐算法原理
信息越来越海量,用户获取信息越来越茫然,而推荐算法则能有助于更好的匹配海量内容和用户需求,使之更加的"有的放矢" .为让产业各方更好的了解算法分发的相关技术和原理,我们特整理了当下 ...
- 今日头条的文章推荐机制是什么?
今日头条的文章推荐机制是什么? 木木博客2015-03-28 11:15:54阅读(3982)评论(3)分享到 众所周知,今日头条是个个性化的新闻推荐引擎,在短短两年多的时间内拥有了2.2亿用户,每天 ...
- 用今日头条的方法推荐公开课
做了个APP,名字很土,叫<学啥>.用今日头条的方法推荐公开课.服务端是阿里云CentOS7+Play!+Scala+Docker+Appache Mahout, 爬虫是Scrapy,做了 ...
- 蚂蚁金服核心技术:百亿特征实时推荐算法揭秘
小叽导读:文章提出一整套创新算法与架构,通过对TensorFlow底层的弹性改造,解决了在线学习的弹性特征伸缩和稳定性问题,并以GroupLasso和特征在线频次过滤等自研算法优化了模型稀疏性.在支付 ...
- 头条45K的推荐算法工程师,需要具备怎样的技能
推荐作为人工智能领域最为重要的分支,人才需求量在最近几年也一直不断地增加.只要有海量数据的地方,必然就有推荐的需求,因为信息的过滤是AI时代每个人的刚需.所以从某种意义来讲,千人千面,个性化是AI带来 ...
- 12.20今日头条实习面试总结-算法工程师
版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/John_xyz/article/details/78884425 </div><d ...
最新文章
- 完全基于Transformer的目标检测器,ICLR匿名论文实现视觉、检测统一
- AndroidStudio-4-如何导入项目
- 利用宝塔 开启apache tomcat ssl 失败的解决方法
- 【ruoyi若依】layer 重置大小/resize
- 程序员体健康的各项指标是多少?
- Linux vim使用心得--一些高级话题
- 7 兼容 因特尔十代_换装十代酷睿,里外都是白白的,超频i5提前装机测试
- [MySQL基础]数据库存储数据的特点
- oracle查询sql记录数,oracle查询所有表的记录数SQL
- 一、android XML资源文件详解 —— 从物理上分析
- vsftp限制ip地址访问
- mysql表utf-8 字符串入库编码异常
- 翻译: TensorFlow 2.0 中的新功能
- SMOTE算法(处理非平衡数据)
- 浅谈程序员常去的社区
- 虚拟机安装ubuntu的相关经验总结及常见疑问
- 基于html5贪吃蛇小游戏,H5 canvas实现贪吃蛇小游戏
- 《系统集成项目管理工程师》必背41-60题
- 永久关闭smartGit弹出“非商业用途”的30s界面
- 5G是什么? --5G