UNIQLO销售数据表的主要字段:
store_id:门店随机编号id,无实际意义
city:门店所在城市
channel:销售渠道:线上&线下
gender_group:客户性别:F&M
age_group:客户年龄段
wkd_ind:购买时间:周末&周中
product:产品类别
customer:客户数量
revenue:销售金额
order:订单数量(一个客户可能多次购买)
quant:购买的产品数量
unit_cost:产品的成本(包括制造和营销成本)

要分析的业务问题:
Q1:整体销售情况随时间的变化是怎么变化的?
Q2:不同产品的销售情况是怎么样的?客户更加偏爱哪一种购买方式?
Q3:销售额和产品成本之间的关系

打开python敲代码
首先导入相关的库和数据

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
get_ipython().run_line_magic('matplotlib', 'inline')
#解决中文和负号不正常显示的问题
plt.rcParams['font.sans-serif']='SimHei'
plt.rcParams['axes.unicode_minus']=False#导入数据集
sale=pd.read_csv(r"UNIQLO.csv")

数据初步了解和预处理

sale.info()
#这里显示没有缺失值
#但是查看数据发现,gender_group和age_group中存在Unknow的结果

#查看前5行数据
sale.head()

sale.describe()


发现revenue存在负值,不符合实际情况,销售金额应该大于0。

#对小于等于0的revenue进行计数
sale1=sale[sale['revenue']<=0]
sale1.revenue.value_counts()

#销售金额为负数和0的记录较少,进行直接删除
sale=sale[sale['revenue']>10]
sale.describe()


初步完成数据预处理,接下来结合业务问题进行分析。

Q1:整体销售情况随时间的变化是怎么样的?
#解答思路:和时间变化wkd_ind相关的变量有customer,revenue,order,quant
**

#分组聚合,计算满足条件的字段总值 groupby(),agg()  字典法聚合
#计算周末和周中的顾客总数
sale.groupby(['wkd_ind']).agg({'customer':'sum'})

#另一种聚合方法
sale_grouped=sale.groupby('wkd_ind')
sale_grouped.groups
sale_grouped['customer'].sum()


由上面的表格可知:weekday的顾客数量明显大于weekend。
用直方图表示

#customer随时间的变化
#运行可知,Weekday工作日的顾客数量大于weekend周末
plt.title("不同时间段的客户数量情况")
sns.barplot(x='wkd_ind',y='customer',data=sale)

#用直方图表示销售金额随时间的变化的情况
#运行可知,Weekday工作日的销售金额大于weekend周末
plt.title("不同时间段的销售金额情况")
sns.barplot(x='wkd_ind',y='revenue',data=sale)

#order订单数量随时间的变化
#运行可知,Weekday工作日的订单数量多于weekend周末
plt.title("不同时间段的订单情况")
sns.barplot(x='wkd_ind',y='order',data=sale)

#quant购买的产品数量随时间的变化
#运行可知,Weekday工作日的被购买产品数量多于weekend周末
plt.title("不同时间段的被购买产品数量情况")
sns.barplot(x='wkd_ind',y='quant',data=sale)


A1:weekday工作日的客户数量,销售金额,订单数量,购买的产品数量多于weekend周末。
(疑问:4个直方图好像一样???)

Q2:不同产品的销售情况如何?客户更加偏爱哪一种购买方式?
解答思路:计算不同产品被购买的数量(分组聚合,表格),不同产品的销售金额(直方图,分组)
购买方式:线上和线下。和客户有关的变量:客户年龄,客户性别,客户数量

#查看产品的类别
sale['product'].value_counts()

#分组聚合,计算满足条件的字段总值 groupby(),agg()  字典法聚合
#运行可知,T恤的购买数量最多,当季新品和配件次之,裙子的购买数量最少
sale.groupby(['product']).agg({'quant':'sum'})

#计算不同产品类别的销售金额
sale.groupby(['product'])['revenue'].describe()

#不同产品类别的销售金额进行可视化
#运行可知:毛衣的销售金额最高,配件次之,袜子和短裤的销售金额最低。
plt.title("不同产品类别的销售金额情况")
sns.barplot(x='product',y='revenue',data=sale)

#顾客更喜欢那种购物方式?
#性别&购买方式
##运行可知,无论男女,相比于线上购物,客户都更喜欢线下购物
plt.title("不同性别的购物方式情况")
sns.countplot(y='gender_group',hue='channel',data=sale)

#顾客更喜欢那种购物方式?
#年龄段&购买方式
#运行可知,无论什么年龄段,相比于线上购物,客户都更喜欢线下购物
plt.title("不同年龄段的购物方式情况")
sns.countplot(y='age_group',hue='channel',data=sale,order=sale['age_group'].value_counts().index)


A2:T恤的购买数量最多,当季新品和配件次之,裙子的购买数量最少。
毛衣的销售金额最高,配件次之,袜子和短裤的销售金额最低。
无论男女,相比于线上购物,客户都更喜欢线下购物。
无论什么年龄段,相比于线上购物,客户都更喜欢线下购物。
相比于线上购物,线下购物更受客户欢迎。

Q3:销售额和产品成本之间的关系?
解答思路:产品实际销售单价和产品成本之间的相关性

#计算产品单价
sale['price']=sale['revenue']/sale['quant']
#计算利润
sale['profit']=sale['price']-sale['unit_cost']
sale.head()

#计算产品成本和产品单价的相关性
sale[['unit_cost','price']].corr()

#用热力图表示相关性强弱
plt.title("产品单价和成本的相关性图")
sns.heatmap(sale[['unit_cost','price']].corr())


A3:由运行结果可知:unit_cost和price呈正相关关系,相关系数为0.0502571.说明成本越高,产品的销售单价越高。

思路扩展:利润是如何分布的?是否存在负利润的情况?

plt.title("利润分布情况")
sns.distplot(sale['profit'])

#不同产品类别的利润分布
#可参考这个,思考购买方式、城市和利润之间的关系
sns.boxplot(x='profit',y='product',data=sale)

知识点小结:

分组聚合计数:
方法1:
计算满足条件的字段总值 groupby(),agg() 字典法聚合
#计算周末和周中的顾客总数
sale.groupby([‘wkd_ind’]).agg({‘customer’:‘sum’})
sale.groupby([‘分组条件的变量名’]).agg({‘被分组的变量名’:‘sum’})

方法2:
sale_grouped=sale.groupby(‘wkd_ind’)
sale_grouped.groups
sale_grouped[‘customer’].sum()

第一种字典法聚合比较简单,输出的二维表较美观。

seaborn的各类图表
柱形图:sns.barplot(x=‘变量A’,y=‘变量B’,data=表名)
横向柱形图:sns.countplot(y=‘变量A’,hue=‘分类条件的变量B’,data=表名)
热力图:sns.heatmap(表名[[‘变量A’,‘变量B’]].corr())
直方+折线图:sns.distplot(表名[‘变量A’])
箱线图:sns.boxplot(x=‘变量A’,y=‘变量B’,data=表名)

终于写完了,祝好梦。

UNIQLO销售数据分析python实战相关推荐

  1. 重点客户销售数据分析python_药品销售数据分析--python

    一.数据分析的目的 数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程. 本篇文章中,假设以朝阳医院2018年销售数据为例,目的是了 ...

  2. 超市销售数据分析python_python实战案例:超市营业额数据分析

    实战是学习的最好途径,效率最高,本文不是很长,通过小小的练习,让大家综合运用基础知识,加深印象巩固记忆. 一.读入数据,了解数据 本数据随机生成的假数据,读者可以自己造,也可以通过下方链接下载,或者后 ...

  3. python医药数据分析_药品销售数据分析--python

    一.数据分析的目的 数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程. 本篇文章中,假设以朝阳医院2018年销售数据为例,目的是了 ...

  4. UNIQLO销售数据分析

    背景: 优衣库(UNIQLO)是一家以销售服装为主的企业,成立于1984年,总部位于日本. 当年是一家销售西服的小服装店,现已成为国际知名服装品牌.优衣库仙人董事兼任总经理柳井正在日本首次引进了大卖场 ...

  5. 超市销售数据分析python、求某一个人的营业额总和_Python+pandas使用交叉表分析超市营业额数据!这超市怕是!...

    交叉表是一种特殊的透视表,往往用来统计频次,也可以使用参数aggfunc指定聚合函数实现其他功能.扩展库pandas提供了crosstab()函数用来生成交叉表,返回新的DataFrame,其语法为: ...

  6. Python网络爬虫实战:根据天猫胸罩销售数据分析中国女性胸部大小分布

    Python网络爬虫实战:根据天猫胸罩销售数据分析中国女性胸部大小分布 本文实现一个非常有趣的项目,这个项目是关于胸罩销售数据分析的.是网络爬虫和数据分析的综合应用项目.本项目会从天猫抓取胸罩销售数据 ...

  7. Python网络爬虫实战:天猫胸罩销售数据分析

    本文实现一个非常有趣的项目,这个项目是关于胸罩销售数据分析的.是网络爬虫和数据分析的综合应用项目.本项目会从天猫抓取胸罩销售数据,并将这些数据保存到SQLite数据库中,然后对数据进行清洗,最后通过S ...

  8. python数据分析案例简单实战项目(一)--供应链销售数据分析

    项目背景 作为供应链行业领航企业,怡亚通推动供应链改变中国,不仅是以先进的供应链思维与管理推动中国主要核心城市的商业快速发展,也是以完善的供应链服务布局.开放的新流通平台助力中国1-6线城市以及乡镇的 ...

  9. python数据分析实战案例-Python数据分析案例实战

    原标题:Python数据分析案例实战 至今我们网站已经开设了多个数据分析系列的课程,大部分都是基于算法思路来开展的,课程中着重点在于算法的讲授.软件的使用,案例只是辅助学习.然而很多学员反映,希望可以 ...

最新文章

  1. 单片机shell命令_MCU调试大法:使用串口实现简单shell功能
  2. vsftp虚拟帐户配置
  3. [国家集训队]聪聪可可
  4. await js 报错_async/await优雅的错误处理方法总结
  5. 按比例缩小图片的CSS代码
  6. tesseract 字典下载_qq阅读官方下载-QQ阅读器下载V7.5.0.888官方最新版
  7. 简述人工智能的发展历程图_一图读懂人工智能发展史
  8. 花巨款跟巴菲特吃饭的人,是亏是赚?
  9. 智课雅思词汇---九、mon是什么意思
  10. 基于eclipse+swing+mysql的汽车保养记录系统的开发1-----登录界面的实现
  11. android简单的自定义涂鸦控件
  12. 设置border线条小于1px
  13. 解决ping/telnet本地localhost可以通过 ping/telnet本地ip无法通过问题
  14. IcoFX v3.6.0 ICO图标制作工具中文便携版
  15. 谷歌、亚马逊全面开火,一场前所未有的AI芯片大战
  16. 基因功能预测工具-HMMER的安装
  17. 图解线性相关与线性无关(引出可逆矩阵、奇异矩阵)
  18. Android中APK安装流程解析
  19. 微信小程序系列(6)如何用微信小程序写一个论坛?贴心代码详解(四)搜索页
  20. npm全局安装失败,报-4048错误(npm ERR code EPERMnpm ERR syscall mkdirnpm ERR path C:\…)

热门文章

  1. 无线电池监测系统的全球与中国市场2022-2028年:技术、参与者、趋势、市场规模及占有率研究报告
  2. 区块链开发实战:如何从零打造一个去中心化应用
  3. PMP考试的过与不过
  4. Faster-RCNN PRN网络解析
  5. 20 球弹跳高度的计算
  6. Ubuntu20搭建pytorch深度学习框架——使用增强样本运行Dlinknet提取道路水体(五)——样本增强
  7. 【沉浸式翻译】使用手册
  8. java tika 解析pdf_Tika解析word文件
  9. Fresnel Reflection - 菲涅尔反射
  10. 大数据引领航天产业转入新业态