Data fields

Label - Target variable that indicates if an ad was clicked (1) or not (0).(待预测广告,被点击是1,没有被点击是0。)
I1-I13 - A total of 13 columns of integer features (mostly count features).(总共 13 列数值型特征(主要是计数特征)。)
C1-C26 - A total of 26 columns of categorical features. The values of these features have been hashed onto 32 bits for anonymization purposes. (共有 26 列类别型特征。 出于匿名目的,这些功能的值已散列到 32 位。)
The semantic of the features is undisclosed.(功能的语义未公开。)

When a value is missing, the field is empty.(当缺少值时,该字段为空。)

4千万训练样本,特征连续型的有13个,类别型的26个,没有提供特征名称,样本按时间排序。
6百万测试样本。

Criteo数据集探索相关推荐

  1. criteo 点击率预估_预处理criteo数据集以预测广告的点击率

    criteo 点击率预估 Amany Abdelhalim阿曼尼·阿卜杜勒哈林 Follow跟随 Sep 18 九月18 Preprocessing Criteo Dataset for Predic ...

  2. Criteo数据集预处理

    Criteo数据集介绍和下载 数据集包含各个特征取值和点击率,共39个特征,其中13个数字型特征,26个类别特征.Criteo是CTR模型的benchmark数据集,曾被用于kaggle竞赛. (Ka ...

  3. 【推荐系统】Criteo数据集介绍

    最近在学习一个ctr预估的开源项目,大部分都使用的是Criteo数据集,是非常经典的点击率预估比赛. 数据下载地址:Display Advertising Challenge | Kaggle 或者C ...

  4. DeepFM Pytorch实现(Criteo数据集验证)

    本文主要任务是利用Pytorch实现DeeoFM模型,并在将模型运行在Criteo数据集上进行验证测试. DeepFM模型简述 FM模型善于挖掘二阶特征交叉关系,而神经网络DNN的优点是能够挖掘高阶的 ...

  5. Kaggle下载criteo数据集

    Kaggle下载Criteo数据集 1. 帐号准备 登陆Kaggle并注册帐号. Account->API->Create New Token 生成配置文件 kaggle.json. 2. ...

  6. NLP入门-Task1 数据集探索

    数据集探索 IMDB数据集 下载并处理 IMDB 数据集 index转成文本 THUCNews子集探索 THUCNews子集介绍 数据预处理代码 此部分依据tensorflow教程编写 IMDB数据集 ...

  7. Python基础入门:Task4(day10)Python入门(口袋妖怪数据集探索)--阿里云天池

    Task4 day10 口袋妖怪数据集探索 1.主要函数解释 info() 用于快速浏览数据集信息,行列信息等 df.info()'''<class 'pandas.core.frame.Dat ...

  8. 【NLP实战】Task1 数据集探索

    一.THUCNews数据集 传送门 链接: https://pan.baidu.com/s/1lziUTaCF7VfnuAKXrGftTw 提取码: saag 概述 本数据集是清华NLP组提供的THU ...

  9. 【Python】Autoviz: 一行代码搞定数据集探索并可视化

    数据集各个特征有什么变化趋势.各个特征之间有何关系,我们可以借助Matplotlib.Seaborn等诸多工具来可视化展示,那么有没有一种工具能一次展示所有的关系了? 本文要介绍的Python工具Au ...

  10. Python入门(10)——宝可梦数据集探索

    数据时代的到来刷新了人们探索未知的方式,本文就通过使用数据分析的方式来帮助我更好的了解宝可梦这种神奇的生物,然后再选择最经济实惠,简单好抓的宝可梦来挑战联盟.通过使用搜索引擎,找到了一份包含着从第一代 ...

最新文章

  1. 2020-10-26runtime error: member access within null pointer of type ‘struct ListNode‘ (solution.cpp)错
  2. python获取excel某一列所有值-Python读取Excel一列并计算所有对象出现次数的方法...
  3. ebc是什么意思_UEFI+GPT和Legacy+MBR两种模式安装的系统有什么区别
  4. 《CLR via C#》读书笔记 之 参数
  5. time series 时间序列 | fractional factorial design 部分要因试验设计
  6. 互联网把农业推向“科技仙境”
  7. linux命令cat过滤注释行和空白行
  8. 11-windows下卸载Orcale
  9. MFC中控件的大小和位置自定义代码
  10. 那些属于我自己的牢骚
  11. android 查看系统字体大小,Android 如何获取系统字体大小
  12. 经理人必看的8大网站
  13. 虚拟摄像头之九: IMX8Q 的 camera.imx8.hal 框架详解
  14. matlab小船渡河物理模型,【物理】小船渡河模型及关联速度问题
  15. mysql查询所有男生中姓王的_MySQL的查询练习
  16. 小米android的手机根目录,小米手机用re模式进行刷机。把rom放进根目录,根目录是哪里?...
  17. Leetcode刷题——剑指offer_1
  18. gap year_应该gap year吗?过来人这么说
  19. 【单片机】单片机各系列(51,PIC,AVR,MSP430/432,ARM)介绍
  20. 大龄青年的艰难转行IT之路(二)

热门文章

  1. java filechannel 并发_java.nio中的Channel系列(2)-FileChannel与零拷贝原理
  2. vue-cli3 处理静态文件 下载引用
  3. Linux目录结构、bash的基础命令学习
  4. JQuery中操作Css样式
  5. 十进制到二进制的转换
  6. shell中引号的应用
  7. phpstorm配置ftp,自动更新代码
  8. 题解(5-8)-----寒假练习赛(一)
  9. Argparse 使用
  10. 英寸和厘米的交互python_Python / PyQt4:如何找到显示器的尺寸(以英寸为单位)?...