赛题简介

赛题以新闻APP中的新闻推荐为背景,要求选手根据用户历史浏览点击新闻文章的数据信息预测用户未来点击行为,即用户的最后一次点击的新闻文章,测试集对最后一次点击行为进行了剔除。

赛题数据

赛题以预测用户未来点击新闻文章为任务,数据集报名后可见并可下载,该数据来自某新闻APP平台的用户交互数据,包括30万用户,近300万次点击,共36万多篇不同的新闻文章,同时每篇新闻文章有对应的embedding向量表示。为了保证比赛的公平性,将会从中抽取20万用户的点击日志数据作为训练集,5万用户的点击日志数据作为测试集A,5万用户的点击日志数据作为测试集B。

数据表

train_click_log.csv:训练集用户点击日志
testA_click_log.csv:测试集用户点击日志
articles.csv:新闻文章信息数据表
articles_emb.csv:新闻文章embedding向量表示
sample_submit.csv:提交样例文件

字段表
Field Description
user_id 用户id
click_article_id 点击文章id
click_timestamp 点击时间戳
click_environment 点击环境
click_deviceGroup 点击设备组
click_os 点击操作系统
click_country 点击城市
click_region 点击地区
click_referrer_type 点击来源类型
article_id 文章id,与click_article_id相对应
category_id 文章类型id
created_at_ts 文章创建时间戳
words_count 文章字数
emb_1,emb_2,…,emb_249 文章embedding向量表示

结果提交

提交前请确保预测结果的格式与sample_submit.csv中的格式一致,以及提交文件后缀名为csv。其格式如下:

user_id,article_1,article_2,article_3,article_4,article_5

其中user_id为用户id,article_1,article_2,article_3,article_4,article_5为预测用户点击新闻文章Top5的article_id依概率从高到低排序,例如:

user_id,article_1,article_2,article_3,article_4,article_5
200000,1,2,3,4,5
200001,1,2,3,4,5
200002,1,2,3,4,5
200003,1,2,3,4,5

评分方式

MRR(Mean Reciprocal Rank)首先对选手提交的表格中的每个用户计算用户得分

其中, 如果选手对该user的预测结果predict k命中该user的最后一条购买数据则s(user,k)=1; 否则s(user,k)=0。而选手得分为所有这些score(user)的平均值。

推荐系统通用流程

赛题理解、数据分析、特征工程、召回模块、排序模块等。

新闻推荐系统【DAY1】相关推荐

  1. 【组队学习】【32期】推荐系统-新闻推荐系统实践

    推荐系统-新闻推荐系统实践 航路开辟者:罗如意 领航员:肖桐 航海士:汪志鸿.吴忠强.赖敏材.王辰玥.毛伟.宋禹成.陈雨龙.管柯琴 基本信息 开源内容:https://github.com/dataw ...

  2. 今日 Paper | 新闻推荐系统;多路编码;知识增强型预训练模型等

    2020-01-21 05:41:48 目录 用多尺度自监督表征提高小样本学习的表现 详细了解如何设计和使用一个基于深度学习的新闻推荐系统 几何GCN 提升鲁棒性的多路编码 常识故事生成的知识增强型预 ...

  3. bgb邻居关系建立模型_今日 Paper | 新闻推荐系统;多路编码;知识增强型预训练模型等...

    目录 用多尺度自监督表征提高小样本学习的表现 详细了解如何设计和使用一个基于深度学习的新闻推荐系统 几何GCN 提升鲁棒性的多路编码 常识故事生成的知识增强型预训练模型 用多尺度自监督表征提高小样本学 ...

  4. 【翻译】Bing-CF-IDF+:语义驱动的新闻推荐系统

    本文由 林鸿钊@funco 翻译,仅作为交流学习之用,诚向各方大佬请教. 翻译不易,感谢支持,转载也请注明出处,不胜感激. 翻译:Bing-CF-IDF+:语义驱动的新闻推荐系统 原文:Bing-CF ...

  5. 新闻推荐系统:深度知识感知网络DKN

    DKN: Deep Knowledge-Aware Network for News Recommendation DKN: Deep Knowledge-Aware Network for News ...

  6. Task01:熟悉新闻推荐系统的基本流程(项目结构)

    Task01:熟悉新闻推荐系统的基本流程(项目结构) 0.代码版本 1. 文件说明 2. 流程图示 3. 架构图示[^1] 0.代码版本 该专栏的博客当中涉及的所有代码,均为组队学习期间的版本,大概在 ...

  7. Task01:熟悉新闻推荐系统的基本流程(代码复现)

    Task01:熟悉新闻推荐系统的基本流程 0.代码版本 1.系统信息 2.`python`环境 3.`MySQL`数据库 4.`MongoDB` 5.`Redis` 6.`Node.js` 7. 复现 ...

  8. 基于协同过滤推荐+余弦相似度算法实现新闻推荐系统

    针对海量的新闻资讯数据,如何快速的根据用户的检索需要,完成符合用户阅读需求的新闻资讯推荐?本篇文章主要采用余弦相似度及基于用户协同过滤算法实现新闻推荐,通过余弦相似度算法完成针对不同新闻数据之间的相似 ...

  9. 新闻推荐系统:基于内容的推荐算法(Recommender System:Content-based Recommendation)

    2018/10/04更新 这篇文章似乎被越来越多的小伙伴看到了,所以觉得有必要做一些进一步的详细说明. 首先按照本文所讲解的推荐思路进行新闻推荐的推荐系统,我已经实现并已经放在Github上了.欢迎小 ...

  10. 一、熟悉新闻推荐系统基本流程

    一.悉新闻推荐系统基本流程 环境搭建: vmware + ubuntu20.04(虚拟机) 前端框架: Vue. 后端框架: Flask 数据库: MySQL.MongoDB.redis IDE:vs ...

最新文章

  1. 惠普打印机节能环保认证证书_爱普生和惠普家用打印机哪款好 爱普生和惠普家用打印机对比【区别】...
  2. 无监督学习:从基本概念到四种实现模型
  3. quick 关于触摸的问题
  4. PL/SQL 存储过程学习2 条件语句
  5. 几个使用linux内核的系统,[科普] Linux 的内核与 Linux 系统之间的关系
  6. 前端学习(3272):js中this的使用
  7. CentOS7.0下Hadoop2.7.3的集群搭建
  8. 【Python】import自己的模块报错
  9. 有些人可能也在哪见过这样的HTML5效果
  10. 查看修改oracle数据库字符集
  11. ssis行计数变量_SSIS服务性能计数器指南
  12. iOS App常用的宏
  13. 当代移动通信发展四个阶段
  14. 天使、A轮、B轮……公司不同阶段估值方法大全
  15. DeepFool公式理解
  16. yolo数据集标注软件安装+使用流程
  17. ERP : 总量库存管理
  18. vrchat新手教程_VRChat入门指南| 最新电脑资讯
  19. 桥接模式(Bridge Pattern)
  20. 计算机审计应用的心得体会,计算机审计中级培训心得体会范文

热门文章

  1. springboot整合liquibase(补充)
  2. 3.7计算机网络(IP数据报格式,IP数据报分片,IPv4)
  3. 关于SVN提交不成功问题
  4. R语言数学建模(1):Regression analysis
  5. Uboot 编译问题-“xxx aliased to external symbol xxx”
  6. 什么是脏读?不可重复读?幻读?如何解决?
  7. 思维导图如何助力营销策划
  8. 猿创征文|GaussDB(for openGauss):基于 GaussDB 迁移、智能管理构建应用解决方案
  9. 普元 AppServer 6.5 将springboot应用部署到应用服务器,上传文件时报错:Caused by: org.springframework.web.multipart.Multipar
  10. C语言学习笔记(C程序设计-谭浩强)