达观资讯推荐系统助力打造更懂用户的新闻客户端
互联网环境下信息数量急速上升,资讯的更新极其频繁,几乎每时每刻都在产生资讯,但用户的信息容量有限,使得大部分有价值的信息无法抵达用户,从而造成信息过载;另一方面,如此种类繁多、数量庞大的新闻,大部分是冷门新闻,没有曝光的机会,导致出现物品的“长尾问题”。
据统计,2020年中国手机新闻客户端用户规模达7.11亿,如何打造一款主流的新闻客户端,解决信息过载和长尾问题是关键。个性化推荐技术在解决这两个问题中起着极其关键的作用。新闻资讯中的个性化推荐是根据用户的历史行为数据进行兴趣点深度挖掘,从大量的新闻资讯中找出用户最感兴趣的进行推荐,从而不仅满足了用户本质的信息诉求,改善了用户体验,且大量的新闻资讯也有了曝光的机会,有了适合的受众群体,避免了资源浪费。
除了个性化推荐,相关推荐和热门推荐也被广泛应用到新闻客户端中,本文将对其将对这些推荐类型做详细介绍。
达观推荐逻辑详解
资讯推荐可分为三大类,首先是资讯的个性化推荐,一般在app的首页,根据不同用户的喜好,为其提供“千人千面”的个性化内容;
其次是热门资讯推荐,结合海量用户的行为数据,计算当前热门资讯内容榜单;以及资讯详情页下方的相关推荐,通过内容侧和用户侧两个维度计算资讯相似度进行推荐;
除此之外,在三大类型的推荐技术基础上,可结合地域信息,为用户推荐当地的资讯。
1.做好资讯个性化推荐4大要点
资讯的个性化推荐一般有多个维度的召回策略,包括但不限于:
第一,通过协同过滤、UCB等推荐算法的召回策略;
第二,基于内容的召回:利用达观自研的NLP技术,对资讯内容中的标题、内容等文本信息进行分析,通过标题、标签相似进行召回;
第三,基于行为的召回:根据用户的点击、点赞、收藏、评论、深度阅读等行为分析用户兴趣,基于用户偏好召回;
第四,基于规则召回:为配合资讯的业务需求,一般可加入运营规则对召回策略进行干预,例如:
- 时效性规则:只推荐1个月以内的内容,并且优先推荐最新的资讯内容。
- 多样性规则:例如希望推荐内容中,社会类、娱乐类、科普类呈多样性分布。
- 打散规则:推荐内容中,希望同一个类别,作者不连续呈现。
2.如何制定资讯相关推荐规则
第一,基于内容侧推荐,综合资讯的标题、标签、类别、作者等字段做相似性分析,推荐相似资讯。
第二,基于用户侧推荐,利用用户的协同过滤和物品的协同过滤算法进行推荐。
第三,加入业务规则限制,例如控制新闻字段对相关推荐模型的权重,标签>标题>类别>作者。
3.如何制定资讯热门推荐规则
第一,根据海量用户的点击、点赞等行为数据,计算新闻热度,生成排行榜单进行推荐。
第二,根据时间维度,加大24小时内的新闻的权重,保证最新的新闻的曝光率。
第三,合理调整热门推荐刷新机制,如2-4小时计算一次热门榜单。
第四,结合app定位,调整不同行为对热门模型的权重影响,如加大深度阅读行为或者分享行为的权重。
第五,行为对热门模型的影响度按时间递减,例如今天的点击行为权重高于昨天的点击行为权重。
目前,在媒体和资讯行业达观已经服务江苏广电、陕西广电、深圳广电、澎湃新闻、人民网、四川日报、广而告之、WiFi万能钥匙、聚看点等几十家知名客户。在客户服务过程中,达观智能推荐团队针对客户应用场景,从业务、监管、特定推荐等角度,提供推荐模型的定制和优化。
此外,达观数据智能推荐产品在银行业、视频等各个领域进行应用,客户涵盖招商银行、浦发银行、民生银行、江苏银行、宁波银行、中国移动、长虹、安利等近百家各行业龙头企业。
达观资讯推荐系统助力打造更懂用户的新闻客户端相关推荐
- GrowingIO B 轮融资3000万美元 打造更懂用户和增长的行为分析产品
在数据分析行业布局三年后,GrowingIO 正在用产品和服务影响更多的用户,通过打造业内领先的基于用户行为的分析产品和增长整体解决方案,帮助产品经理.运营.增长负责人等落地增长,逐步成为行业的领导者 ...
- 华为云弹性云服务器助力打造更安全可靠、灵活高效的云空间
华为云弹性云服务器助力打造更安全可靠.灵活高效的云空间 云服务器大家一定都听说或者了解过,那我们今天来了解一下什么是弹性云服务器,弹性云服务器(Elastic Cloud Server)简而言之,是为 ...
- 利尔达蓝牙空调接收器方案助力打造更舒适的公路生活
中国公路交通承担着全社会70%以上的货运量和客运量,在分工越来越细的经济环境下,卡车更是发挥着"工业血管"的重要作用.随着司机们对生活品质的日益看重,车载产品进入高速增长期. 利尔 ...
- HMS Core AR Engine 2D图片/3D物体跟踪技术 助力打造更智能AR交互体验
AR技术已经被广泛应用于营销.教育.游戏.展览等场景.通过2D图像跟踪技术和3D物体跟踪技术,用户只需使用一台手机进行拍摄,即可实现海报.卡牌等平面物体以及文物.手办等立体物体的AR效果.尽管近年来2 ...
- 苏宁大数据怎么运营_苏宁云商:挖掘大数据 只为更懂用户的心
国际在线江苏频道报道(詹世文):如今,在使用购物.旅游等APP时,在"相关推荐"栏目里中似乎总能发现自己心仪的物件,为什么这些软件会这么"懂你"?南京软博会开幕 ...
- 【情景感知服务】让你的音乐APP更智能更懂用户(增加demo源代码)
场景 情景感知服务能带来什么 作为音乐发烧友,闲下来的时候总想打开App,享受沉浸在音乐中的放松.然而,App推荐的歌单经常没法满足我的需要,如果App能根据我当前的情景状态,推送给我的歌曲恰好就是我 ...
- 一款更懂用户的在线文档创作工具-baklib上线了
在日常的工作和生活中你是否遇到过这样的情况:有时候工作中想要用到的某个文档,翻遍了整个电脑存储盘却怎么也找不见了,那些用来记录知识点笔记的小本子密密麻麻,我们无法方便的书写.存储和利用知识.我们缺少了 ...
- 百度世界大会最全官方回顾:今天,百度更懂你!
百度 百度无人驾驶汽车最快将于2018年实现量产. 百度Apollo疲劳驾驶监测系统问世. 手机百度累计激活用户20亿,信息流日阅读量月复合增长36%,短视频日阅读量月复合增长38%. 未来,百度AI ...
- 百度世界发布渡鸦新品,软硬件结合更懂生活
百度世界发布划时代产品,软硬件结合更懂智能生活 11 月 16 日,2017 百度世界大会在北京盛大举行.百度在会上发布了手机百度 10.0 和全新人工智能硬件"Raven H"等 ...
最新文章
- Android新手之旅(10) 嵌套布局
- Nhibernate使用动态Expression的问题解决
- Vue之@click、事件修饰符@click.stop与@click.prevent、按键修饰符@keyup.enter
- java执行顺序_java执行顺序
- CGLIB代理到底是个什么东西?这是一篇最全的CGLIB大全
- ACM MM18 | 用于跨模态检索的综合距离保持自编码器
- tensorboard ckpt pb 模型的输出节点_PyTorch 1.1.0发布,官方支持TensorBoard,还有更多性能提升!...
- [系统安全] 三十一.恶意代码检测(1)恶意代码攻击溯源及恶意样本分析
- maven安装以及eclipse配置maven
- IPv6名称到地址的转换函数getaddrinfo()详解
- python编写应用程序错误_运行简单的Python Flask web应用程序时出错
- android自定义控件 jar,Android Studio引用自定义的framework.jar包
- 013.Makefile
- android中的用户资源访问(一)
- delphi 算术溢出解决方法_文言文代码算什么?跟着九章算术学Python编程才厉害...
- 写shell工具类,一个常用实例
- React使用详解(学习笔记)
- 东芝打印机共享怎么设置_东芝2303am网络打印设置教程
- 计算机网络重置,怎么重置电脑网络连接
- 翁恺老师 | 城堡游戏解读