Dataset之OttoGroup:OttoGroup数据集的简介、下载、案例应用之详细攻略

目录

OttoGroup数据集的简介

OttoGroup数据集的下载

OttoGroup数据集的案例应用


OttoGroup数据集的简介

官网:https://www.kaggle.com/c/otto-group-product-classification-challenge/overview/description

Otto Group数据集来源于《Otto Group Product Classification Challenge》。Otto集团是世界上最大的电子商务公司之一,在20多个国家拥有子公司,包括Crate & Barrel (USA), Otto.de (Germany) and 3 Suisses (France)。我们每天在全球销售数百万种产品,在我们的产品线中添加了数千种产品。
       我们公司对我们产品性能的一致性分析至关重要。然而,由于我们的全球基础设施不同,许多相同的产品被分类不同。因此,我们的产品分析的质量在很大程度上取决于对类似产品进行准确分类的能力。分类越好,我们对产品范围的了解就越多。
       在这次竞争中,我们为超过200000种产品提供了一个具有93项功能的数据集。目的是建立一个预测模型,能够区分我们的主要产品类别。获奖模型将采用开源模式。

1、电商商品分类

  • – Target:共9个商品类别
  • – 93个特征:整数型特征

2、数据集简介

Each row corresponds to a single product. There are a total of 93 numerical features, which represent counts of different events. All features have been obfuscated and will not be defined any further.
        There are nine categories for all products. Each target category represents one of our most important product categories (like fashion, electronics, etc.). The products for the training and testing sets are selected randomly.

每行对应一个产品。共有93个数字特征,代表不同事件的计数。所有功能都已模糊化,将不再定义。
        所有产品都有九个类别。每个目标类别代表我们最重要的产品类别之一(如时装、电子等)。培训和测试集的产品是随机选择的。

File descriptions

  • trainData.csv - the training set
  • testData.csv - the test set
  • sampleSubmission.csv - a sample submission file in the correct format

Data fields

  • id - an anonymous id unique to a product   产品独有的匿名ID
  • feat_1, feat_2, ..., feat_93 - the various features of a product    产品的各种特性
  • target - the class of a product                    产品的类别

OttoGroup数据集的下载

如需资料,请留言向博主索取。

OttoGroup数据集的案例应用

后期更新……

Dataset之OttoGroup:OttoGroup数据集的简介、下载、案例应用之详细攻略相关推荐

  1. DL之FAN:FAN人脸对齐网络(Face Alignment depth Network)的论文简介、案例应用之详细攻略

    DL之FAN:FAN人脸对齐网络(Face Alignment depth Network)的论文简介.案例应用之详细攻略 目录 FAN人脸对齐网络(Face Alignment depth Netw ...

  2. ML之VC维:VC维(Vapnik-Chervonenkis Dimension)理论的概述(衡量模型复杂度和预测能力的指标)的简介、案例理解之详细攻略

    ML之VC维:VC维(Vapnik-Chervonenkis Dimension)理论的概述(衡量模型复杂度和预测能力的指标)的简介.案例理解之详细攻略 目录 VC维(Vapnik-Chervonen ...

  3. ML之PPMCC:PPMCC皮尔逊相关系数(Pearson correlation coefficient)、Spearman相关系数的简介、案例应用之详细攻略

    ML之PPMCC:PPMCC皮尔逊相关系数(Pearson correlation coefficient).Spearman相关系数的简介.案例应用之详细攻略 目录 PPMCC皮尔逊相关系数的简介 ...

  4. Python命令行解析:sys.argv[]函数的简介、案例应用之详细攻略

    Python命令行解析:sys.argv[]函数的简介.案例应用之详细攻略 目录 sys.argv[]函数的简介 sys.argv[]函数的案例应用 1.基础测试 2.进阶用法 3.sys.argv[ ...

  5. CV之PoseEstimation:Pose Estimation人体姿态估计(AI识人,OpenPose+DeepCut+RMPE+Mask RCNN)的简介、案例应用之详细攻略

    CV之PoseEstimation:Pose Estimation人体姿态估计(AI识人,OpenPose+DeepCut+RMPE+Mask RCNN)的简介.案例应用之详细攻略 目录 Pose E ...

  6. Py之matplotlibseaborn :matplotlibseaborn绘图的高级进阶之高级图可视化(基础图(直方图等),箱线图、密度图、小提琴图等)简介、案例应用之详细攻略

    Py之matplotlib&seaborn :matplotlib&seaborn绘图的高级进阶之高级图可视化(基础图(直方图等),箱线图.密度图.小提琴图等)简介.案例应用之详细攻略 ...

  7. C++:C++编程语言学习之数学运算运算符及其优先级的简介、案例应用之详细攻略

    C++:C++编程语言学习之数学运算&运算符及其优先级的简介.案例应用之详细攻略 目录 1.C++语言的数学运算 1.1.C++ 内置了丰富的数学函数,可对各种数字进行

  8. ML:机器学习模型提效之监督学习中概率校准的简介、案例应用之详细攻略

    ML:机器学习模型提效之监督学习中概率校准的简介.案例应用之详细攻略 目录 监督学习中概率校准的简介 监督学习中概率校准的概述 监督

  9. VB.net:VB.net编程语言学习之添加引用打包安装项目的简介、案例应用之详细攻略

    VB.net:VB.net编程语言学习之添加引用&打包安装项目的简介.案例应用之详细攻略 目录 关于添加引用 1.SW的二次开发,需要引用多个Solidworks库文件即dll文件

  10. VB.net:VB.net编程语言学习之操作符(变量/常量/数据类型/声明)逻辑控制语句(条件判断/循环语句)的简介、案例应用之详细攻略

    VB.net:VB.net编程语言学习之操作符(变量/常量/数据类型/声明)&逻辑控制语句(条件判断/循环语句)的简介.案例应用之详细攻略 目录 VB.net编程语言学习之操作符/变量/常量/ ...

最新文章

  1. highcharts常用配置说明
  2. PHP IDE phpstorm 快捷键
  3. 高电压技术思维导图_钢铁技术:钢铁行业板坯连铸结晶器振动常见故障思维导图...
  4. 进击吧! Blazor !第五期 安全
  5. 【2019CSP-J 普及组题解】数字游戏(number),公交换乘(transfer),纪念品(souvenir),加工领奖(work) CSP普及游记
  6. android tag定义快捷键,Android Studio快捷键生成TAG、Log.x日志输出介绍
  7. 转整型_156.Ruby烘焙大理石豆沙吐司解锁大理石花纹整型
  8. Asterisk权威指南/第二章 Asterisk架构
  9. ThinkingInJava 学习 之 0000002 操作符
  10. 124.二叉树中的最大路径和
  11. CH341/CH340Linux驱动使用教程
  12. Traceback (most recent call last):IndexError: list assignment index out of range
  13. php 开源 采集,poscms火车采集教程
  14. 经典排序算法之:堆排序
  15. Windows_Program_Via_C_Translate_Win32编程的背景知识/基础知识_包括基本输入输出机制介绍...
  16. 公司邮箱注册申请流程,好用的邮箱功能开启高效办公
  17. 堆中存什么?栈中存什么?
  18. CUDA安装和检测【全】(nvcc命令找不到的解决办法)
  19. Vue如何循环渲染图片
  20. 华为手机对比参数配置平台_华为mate40pro和iqoo5pro哪个好华为mate40和iqoo5参数对比测评...

热门文章

  1. oracle 行送,Oracle 行专列
  2. 面试python的理解_Python面试中会遇到的一些问题,和自己的理解。
  3. dev layoutview 怎么显示大小_Liunx驱动学习:基于imx6ul 驱动oledssd1306 实现终端显示...
  4. cloudstack4.11 centos7 安装文档
  5. go标准库的学习-errors
  6. 【mongodb用户和身份认证管理】
  7. Perl匿名数组、hash和autovivification特性
  8. ASP技巧实例:几行代码解决防止表单重复提交
  9. 怎么对 Java 程序调优?不看别后悔!
  10. 不小心执行了 rm -f,先别急着跑路