本文从谷歌新闻、搜狐新闻、今日头条的推荐系统,分析新闻资讯行业,推荐系统采用的主要策略。

1、谷歌新闻

Rec(article) =IF(article) ×CF(article)

IFarticle)内容过滤

GoogleNews把新闻文章分类到预先定义好的话题类别中,包括国际、体育、娱乐等

日志分析中,根据用户的搜索和点击行为,构建贝叶斯框架,预测用户新闻事件兴趣。

CFarticle)协同过滤

把用户聚类,让与这个用户有着同样兴趣的其他用户帮助完成个性化推荐的过程。

2狐新闻

特色:构建了丰富的内容分类树形体系,可以反复优化,运营干预色彩重。

内容分类:标签词、主题、子频道、频道、话题、热点、地域、来源等

用户:用户分群、建立用户画像、与内容分类对应。

新闻入库:内容同步、抽取(基于正文内容特征;基于标题、摘要的关键词)。

推荐:计算新闻关键词与标签词、主题、子频道、频道的距离。

修正:根据转化率等指标、反复修正用户画像和内容分类。

3、今日头条

特色:丰富的推荐逻辑

基于相似文章主题相似性的推荐:通过获取与用户阅读过文章的相似文章来进行推荐。

基于相同城市的新闻:对于拥有相同地理信息的用户,会推荐与之相匹配的城市的热门文章。

基于文章关键词的推荐:对于每篇文章,提取关键词,作为描述文章内容的一种特征。然后与用户动作历史

关键词进行匹配推荐。

基于站内热门文章的普适性推荐:根据站内用户阅读习惯,找出热门文章,对所有没有阅读过该文章的用户进行

推荐

基于社交好友关系的阅读习惯推荐:根据用户的站外好友,获取站外好友转发评论或发表过的文章进行推荐。

基于用户长期兴趣关键词的推荐:通过比较用户短期和长期的阅读兴趣主题和关键词进行推荐。

基于相似用户阅读习惯的列表推荐:计算一定时期内的用户动作相似性,进行阅读内容的交叉性推荐。

基于站点分布来源的内容推荐:通过用户阅读的文章来源分布为用户计算出20个用户喜欢的新闻来源进行推荐

新闻推荐:谷歌新闻、搜狐新闻、今日头条调研分析相关推荐

  1. 自媒体们的新战场:搜狐新闻客户端

    种种迹象表明,以微博草根大号.微信公众号.媒体人为代表的自媒体人群,即将迎接自己的第三个阵地:新闻客户端;与此同时,新闻客户端也有望成为"类微信APP"的一员,跻身移动互联网第三大 ...

  2. 在线产品经理实习 任务三:给搜狐新闻24小时热点做一份产品说明文档

    任务三:给搜狐新闻24小时热点做一份产品说明文档 一.任务简介及要求 出题人:苏伟 搜狐新闻高级产品经理 自从搜狐新闻APP推出了24小时热点后,反响还不错,数据也增长挺快的.市场部和销售部跟我们产品 ...

  3. 【iOS_GitHub】新闻频道栏(网易新闻,新浪新闻,搜狐新闻,今日头条,聚划算,腾讯视频,优酷等类的频道栏),支持小红点标识 懒加载 缓存 排序 增删等

    NewsChannel(新闻频道栏) Ready 新闻频道栏(网易新闻,新浪新闻,搜狐新闻,今日头条,聚划算,腾讯视频,优酷等类似的频道栏) 支持小红点标识 && 懒加载 && ...

  4. 搜狐新闻如何玩?张朝阳演讲透露玄机

    12月14日,或许是为了支持搜狐前员工董江勇和陈中,张朝阳亲临WeMedia举办的自媒体年会现场,这位"中国互联网的活化石"成为最为重磅嘉宾,脱稿演讲把其多年来做网络媒体的经历.读 ...

  5. python新闻爬虫教程_python简易爬虫教程--(一)批量获取搜狐新闻

    我们先从简单的抓取文本信息开始,来写我们的第一个爬虫程序,获取搜狐新闻的内容. 我们首先来介绍一下我们需要用到的库. 爬虫程序的步骤,一般可以分为三步: 1.获取网页源码(html源码): 2.从代码 ...

  6. “搜狐新闻马拉松”热身 张朝阳带着一大波明星提前跑起来了

    提起中国互联网圈的不油腻中年男,搜狐董事局主席兼CEO张朝阳绝对能拿下一席.今日,又有网友晒出张朝阳在奥森跑步的照片,从曝光的照片来看,和张朝阳一起跑步的既有张宁江.田家达这样的运动健将,也有杨昊铭. ...

  7. AI赋能新闻播报 搜狐新闻客户端联合搜狗打造首个明星“数字人”主播

    5月17日,在北京举行的"搜狐科技5G&AI峰会"上,搜狐新闻客户端联合搜狗推出首个明星"数字人"主播,以高度逼真的明星形象.多种方言实时播报新闻,让用 ...

  8. python爬虫搜狐新闻_应用案例2:爬取搜狐体育的新闻信息

    爬虫学习使用指南 Auth: 王海飞 Data:2018-06-25 Email:779598160@qq.com github:https://github.com/coco369/knowledg ...

  9. 【数据挖掘实验】利用朴素贝叶斯方法对百万搜狐新闻文本数据进行分类

    一.概述 本实验做的是一个很常见的数据挖掘任务:新闻文本分类. 语料库来自于搜狗实验室2008年和2012年的搜狐新闻数据, 下载地址:https://www.sogou.com/labs/resou ...

最新文章

  1. Streaming K-Means、Fuzzy C-means、Canopy
  2. hdu 2191 多重背包入门
  3. VMware与Centos7系统安装
  4. Android从url不产生cookie,如何从android.webkit.CookieManager获取所有cookie或cookie的URL
  5. 前端学习(2346):global全局样式布局
  6. NetStatusEvent info对象的状态或错误情况的属性
  7. 一年收入多少才能支撑自驾环游中国?
  8. 凭一张照片找到视频中你所有的镜头,包括背影丨商汤ECCV 2018论文
  9. SpringMVC上传文件的三种方式
  10. 除了大家知道的navicat,再介绍两款免费的数据库连接工具
  11. 计算机函数公式法计算出总分的式子,excel计算百分比公式的用法
  12. javascript中一个字符占几个字节
  13. 软件测试之因果图法(P24——P26)
  14. 秘密:从程序员到领导者的微妙之处
  15. Android 方法耗时打印插件
  16. Linux知识点整理(五)—— Linux 磁盘与文件系统管理
  17. 经典美文诵读2 If I Were a Boy Again假如我又回到了童年
  18. JavaWeb HTML
  19. MathType 6.9中积分符号不显示该怎样解决
  20. c语言知识地图,AI之旅(5):正则化与牛顿方法

热门文章

  1. 正弦稳态电路的相关概念
  2. 上海财经应用统计考python_上海财经大学应用统计专硕考研经验帖
  3. 豆瓣网书影音页面制作(父子组件,拼音查询中文)
  4. 【转载】人生如梦游戏间,RPG游戏开源开发讲座(JAVA篇)[3]——邯郸学步
  5. 科普:SAS是什么语言
  6. mysql查询表中不重复数据
  7. 数据中台开源解决方案(一)
  8. 深入理解JVM的对象创建过程
  9. js快捷获取超链接参数和修改超链接(新增URLSearchParams方法获取参数)
  10. unfortunately activity has stopped