目录

数据说明

数据说明

数据预处理​​​​​​​

数据分析

区域分析

价值分析

产品分析

各字段的交互分析

结论说明


数据说明

本次数据来源于京东2020年5月25日 大家电-冰箱的订单数据 按照10%的随机抽样后进行数据脱敏最后得到的订单数据,共有订单数据大约70K,数据来源于公开网络数据。

数据来源:京东冰箱订单数据集 - Heywhale.com

数据乱码参考代码:电商数据分析项目总结!_51CTO博客_电商数据分析项目

数据字段说明:

1、用户账号、父订单号、订单号仅仅是一个id,本文因为时间问题,不作为分析目标(如果时间允许,可以分析用户的购买情况,包括复购率之类的)。

2、订单日期没用,因为只有一天且订单时间里面包含了日期及其具体时分秒的数据。

3、商品SKU也用不到分析中,商品SKU在实际中是对商品属性的数字化,可以根据这个信息追踪到具体的商品。

4、一、二、三级品类名称无用,因为每个品类只有一种,没有分析意义。

5、用户会员等级的范围在50~100左右,根据京东的会员等级,这些等级隶属于同一个等级所以不具备分析意义。

综上所述,得到如下的分析字段及其分析思路。

数据预处理

1、对品牌名称进行名称统一,剔除掉品牌名称的英文名

2、商品名称与品牌名称无法匹配,统一匹配数据

这类相关的评语数据被当成购买数据,可能出现同一次购买记录多次出现的现象,故考虑剔除相关数据。

3、 订单数据与城市位置数据匹配,并剔除匹配后的缺失数据

4、获取有效完成订单的数据,并计算以小时为单位的时间、附加金额和时间差等数据

其中,有效订单标志为1,且取消订单标志为0的数据被认为是完成购买行为的记录。但其他组合的数据并不知代表的含义!附加金额包含两部分,一部分是产品购买后的运费险、三年保修之类的保险附加产品,另外一部分是用户叠加优惠价值,本文缺少其中一个数据,在实际中若有其中一个数据可以进行计拆解计算折损率、附加产品价值等指标。

数据分析

区域分析

从省份的订单量上看,广东省、北京市、上海市的订单量最多, 其次是江苏省和四川省。从地区划分看,沿海、中部地区的省份具有较多的订单量。

省份交易金额的分布,同省份订单量的分布结果大致相同。

结合省份的销售数量和交易金额分布,可以对当前地区的物流商进行整合调优。对盈利较小的地区固定低价高性价比的物流商或者直接取消对该地区的销售渠道;例如:综合实力较弱的企业对新疆、西藏、云南、黑龙江、内蒙古等区域暂时考虑不进行销售,降低企业的物流成本,集中精力主攻主要销售省份的销售目标。对盈利较大的地区应根据当前的物流成本信息进行调整。其中,tw地区的数据是为了让图片不违反规定的处理的。

价值分析

1、优惠前单价的数据分布

冰箱产品的销售价格主要是高低端的较多,中端产品的分布相对于其他两个层次的较少。特高端的产品订单量有所分布,但数量很少。同时,超低价产品的销售情况也存在,这是薅羊毛还是上架错误导致的?

2、优惠价格的数据分布

优惠价格主要是商家考虑的成本折损率,优惠价格小于100元的产品优惠是占大多数的,其次是价格为100-700元之间的产品优惠,大额优惠价格也存在,但数量少,估计是特高端产品的优惠策略。

3、当天各时段的实际支付价格、销售数量及其优惠情况

        实际支付价格和销售数量在当前的0点时是最大值,可能0点是活动开启的时间,此时商家给到的优惠力度是当天最大,所以呈现这个现象。由于一点到七点是休息时间,故此时间段内的人流量最少,销售情况也最为低迷。之后的时间段,销售情况有一定的提升,但提升不大,总体较为平均。

4、下单时间与支付时间间隔的分布情况

下单后立刻支付的销售数量较多,间隔时间大于1分钟的客户开始逐渐减少,说明多数用户对商品的购买意愿较强,一定的促销活动能够促进客户对商品的购买行为。

5、下单与支付间隔时间的支付均价

间隔为1分钟左右的实际支付价格的均值较小,间隔大于1分钟后的实际支付价格的均值较大,且在四个半小时时出现了最大值。结合各时段的订单量、销售数量和优惠占比分析可知,原因是间隔小于1分钟时是促销力度最大的时候,此时主打的促销策略可能是薄利多销。

产品分析

在完成订单情况下,海尔的销售量最多,其次是容声、康佳、西门子、美的、志高等品牌。

从销售量和销售金额分析,西门子的销售数量小于容声,但销售金额大于容声,说明西门子的单价要比容声大。同理,低单量高单价的品牌有松下、海信、美菱、格力、卡萨帝等品牌。根据西门子和容声的关系进行方向分析可知,康佳的销售量位居第三,但销售量位居第八,是一种高单量低单价的产品品牌。同理,高单量低单价的品牌有容声、TCL、奥克斯等品牌。

从优惠金额分析,容声的销售数量不如海尔的销售数量,但容声的优惠金额高于海尔的优惠金额,且容声属于高单量低单价的产品品牌,在价格方面具有较大的优惠性;若在其他方面相同时,容声品牌的产品具有较大的性价比。同理、类似属性的有西门子、海信、格力、美的等品牌。

京东自营品牌中海尔、容声、西门子、康佳、海信等品牌的占比量较大。非京东自营的品牌中海尔、志高、奥克斯、美的、现代的品牌占比量较大。分析可知,是否为京东自营的品牌具有较大的差异性。

各字段的交互分析

1、时间与地区的交互分析

从图中可知,北京、上海、广东、江苏等省份具有较大的销售分布。在销售当天,北京和广东全天都有销售情况,广东销售主要分布在0~4点和11点之后,北京全天的销售较为平均,并无太多重点销售时段。上海在2点的销售低迷外,4~13点之间是该地区的销售重点时段,其他时段的销售情况较为均衡。江苏在除了4、21、23点三个时间点较为低迷,10~12点有较大的峰点,其他时段较为平均。

2、时间与品牌的交互分析

从时段和品牌的分析中可知,西门子、海尔、容声三大品牌的销售情况较好。西门子主要销售时段集中在0~7点和22~23点两个时间段,其他时段销售情况稍弱些。海尔主要销售时段集中在8点之后,8点之前的销售情况也稍弱些。容声的销售情况主要集中在3点和23点,但总体上销售能力较为均衡。

3、地区与品牌的交互分析

从地区和品牌的销售情况分析,先科、申花、多方达三个品牌在各地区的销售情况都较差。

特定地区销售品牌:长虹的主要销售区域在安徽,格兰仕的主要销售区域在四川和北京,小米的主要销售区域在安徽和浙江,统帅的销售区域主要在上海。

高销量区的品牌分布情况:广东地区除先科、多方达、小米、格兰仕、申花、统帅和长虹等品牌外均有较好的销售情况;北京地区除先科、多方达、小米、小鸭牌、杨子、申花和长虹等品牌外均有较好的销售情况;上海地区除上菱、先科、多方达、小米、杨佳、杨子、格兰仕、澳柯玛、申花、长虹和长城。

4、品牌与是否自营的交互分析

结合之前的饼图也可知,海尔在是否自营方面销售情况都较好;西门子、美菱、海尔、海信、格力、松下康佳和容声等主要分布还是京东自营。美的、志高、奥克斯为京东非自营。

5、时段与自营属性的交互分析

        非自营的产品在0点时有一定的销售量,在其他时段内的销售量较为惨淡。自营产品在0点时销售量最多,其次是6~12点和20~23点两个时间段的销售量较多,其他的时段的销售量较为平均。

结论说明

区域分析:

        产品的销售订单主要分布在沿海和中部的地区,其中,一线城市和江苏等地销量最高。

值分析价:

        冰箱行业,低高端产品的购买量较多,中端产品相对其他两个层次的购买量较少。优惠价格方面,主要分布在0~100元,100~700元也有较少分布。

时间分析:

        在0点时,产品的销售量和促销力度是最大的,其他时段的销售量较为平均。同时,一分钟内的交易订单数量较多,说明大多数客户在促销活动前已经有购买意向。

产品分析:

        根据销售数量和销售金额可知,冰箱产品分为两种类型——低单量高单价(松下、海信、美菱、格力、卡萨帝等品牌)和高单量低单价(康佳、容声、TCL、奥克斯等品牌)。在销售产品中,京东自营产品占大多数。

交互分析:

时间与地区:北京、上海、广东、江苏等省份具有较大的销售分布,其中上海和广东全时段的销售量都较大。

时段与品牌:西门子、海尔、容声三大品牌的销售情况较好,其中海尔和西门子全时段的销售情况较好。

地区与品牌:先科、申花、多方达三个品牌在各地区的销售情况都较差;长虹、格兰仕、小米、统帅有特定的销售区域以及其他品牌的产品有高销售区域。

京东订单交易数据分析相关推荐

  1. 电商平台订单交易数据分析

    前言 本文根据某电商平台的实际订单交易数据,对2019年的交易情况进行分析,包括数据清洗.可视化.分析以及构造建立RFM模型. 1加载提取数据 1.1加载 数据包含如下字段:orderID:订单编号: ...

  2. python 京东_Python数据分析-京东订单数据分析实战

    本次数据来源于京东,类目为大家电-家用电器-冰箱,抽取2020年5月25日10%数据,数据量为 70k+,在 jupyer notebook 内进行分析. 数据文件: 链接:迅雷云盘:提取码:ezQq ...

  3. kaggle电子商务数据在线零售商的实际交易数据分析

    背景 这是一个跨国数据集,其中包含2010年12月12日至2011年12月9日之间在英国注册的非商店在线零售的所有交易.该公司主要销售独特的全时礼品.许多客户该公司是批发商. 数据下载地址:https ...

  4. 【2023年第十一届泰迪杯数据挖掘挑战赛】B题:产品订单的数据分析与需求预测 23页论文及实现代码

    [2023年第十一届泰迪杯数据挖掘挑战赛]B题:产品订单的数据分析与需求预测 23页论文及实现代码 相关链接 (1)建模方案 [2023年第十一届泰迪杯数据挖掘挑战赛]B题:产品订单的数据分析与需求预 ...

  5. 【2023年第十一届泰迪杯数据挖掘挑战赛】B题:产品订单的数据分析与需求预测 建模及python代码详解 问题一

    相关链接 [2023年第十一届泰迪杯数据挖掘挑战赛]B题:产品订单的数据分析与需求预测 建模及python代码详解 问题一 [2023年第十一届泰迪杯数据挖掘挑战赛]B题:产品订单的数据分析与需求预测 ...

  6. 京东2020校招数据分析工程师二面(2019.9.18)

    九月跑东跑西,相比前两个月的刷题输入,更多的在输出和打磨面试经验.跑了很多面试,不断挂挂挂挂挂,这是第一次进了二面. 地点: 广州 岗位:数据分析工程师 京东笔试传送门: <京东2020校招数据 ...

  7. 京东订单拉取接入流程

    1,创建应用获取appKey,appSecret,SKD下载 需要缴费:入鼎费用,安全包购买费用 2 , 订单拉取服务(新工程),创建在云鼎上 需要调用接口: /** * 获取京东订单列表 * @th ...

  8. 淘宝店铺订单解密接口/淘宝店铺订单插旗接口/淘宝店铺订单交易接口/淘宝店铺商品上传接口/淘宝店铺订单明文接口/代码对接分享

    淘宝店铺订单解密接口/淘宝店铺订单插旗接口/淘宝店铺订单交易接口/淘宝店铺商品上传接口/淘宝店铺订单明文接口/代码对接分享: 1.公共参数 名称 类型 必须 描述 (接口代码分享交流wx1997010 ...

  9. 淘宝店铺订单交易接口/淘宝店铺商品上传接口/淘宝店铺订单解密接口/淘宝店铺订单明文接口/淘宝店铺订单插旗接口代码对接分享

    淘宝店铺订单交易接口/淘宝店铺商品上传接口/淘宝店铺订单解密接口/淘宝店铺订单明文接口/淘宝店铺订单插旗接口代码对接分享如下: 1.公共参数 名称 类型 必须 描述 (接口代码交流wx:1997010 ...

最新文章

  1. Ubuntu 16.04+GTX970 黑屏无法安装解决方法
  2. 关于Unsupported major.minor version 52.0报错问题解决方案
  3. java.io.IOException: No space left on device
  4. SAP Spartacus delivery mode continue button enable与否的逻辑
  5. 春节期间小游戏同时在线人数最高达2800万人/小时
  6. aix系统下oracle之ora-00471,Oracle RAC 9.2.0.7 (AIX53,HA52)三台主机实例全down的问题
  7. JS当中的无限分类递归树
  8. 测试开发系类之接口自动化测试
  9. 中国颜色(鼠标双击)
  10. 5G商用正式启动:最全套餐资费详情都在这里了
  11. MD5,SHA-1,SHA-256摘要加解密
  12. 牛客网 正则表达式匹配
  13. backBarButtonItem 替换
  14. 计算机语言论文标准范文,计算机语言论文大纲范文模板 计算机语言论文提纲怎么写...
  15. 多媒体计算机辅助英语教学,多媒体计算机辅助英语教学初探
  16. python批量转换音频采样率
  17. SuperMap瓦片技术方案
  18. Word太大怎么进行压缩?实用Word压缩工具
  19. 2021.12.15.梦开始的地方.
  20. 【Echarts Gallery】简单使用

热门文章

  1. 2009年河北专接本高校招生计划
  2. TextRank文本摘要算法
  3. Ubuntu18.04搭建nginx rtmp服务器
  4. 逻辑斯蒂回归java_逻辑斯蒂回归模型
  5. 534 java后台写法
  6. 进行LDPC编码时扔掉了前面2Zc的信息位,为何如此设计?在解码时如何恢复?
  7. 循环神经网络(Recurrent Neural Network Model)
  8. 1. Android逆向-Frida环境搭建
  9. 谷歌浏览器常用的快捷键
  10. BIOS学习实战之SMBIOS