import pandas as pd
df = pd.read_csv('D:/data/tmall_order_report.csv')
df.head(50)df.columnsdf.describe()df.info()df.isnull().sum()#缺失值的查看,订单付款时间为空说明没有付款df.duplicated().sum()#重复值查看df.columnsdf.columns = df.columns.str.strip()#去列名的空值
df.columnsdf.shapedf[df.duplicated()].count()#列重复值查看#对收货地址做字符串处理
df.收货地址.unique()#返回列的唯一值df.收货地址=df.收货地址.str.replace('自治区|省|壮族|维吾尔|回族','',regex=True)#regex表示用正则表达式
df.收货地址data1 = df.总金额.sum()
data1data2 = df.退款金额.sum()
data2data3 = df.买家实际支付金额.sum()
data3data4=data3-data2#总收入
data4df[df.订单付款时间.isnull()]#未付款订单df['订单编号'][df.订单付款时间.isnull()].count()result = {}#创建空字典
result['未付款订单数'] = df['订单编号'][df.订单付款时间.isnull()].count()#存入数据
result['已完成订单数']=  df['订单编号'][df.订单付款时间.notnull()].count()
resultresult['总订单数'] = df['订单编号'].count()
result['退款订单数'] = df['订单编号'][df.退款金额>0].count()
result['总订单金额'] = df['总金额'].sum()
result['总退款金额'] = df['退款金额'].sum()
result['总实际收入金额'] = df['买家实际支付金额'].sum()
resultresult1 = {}#创建空字典
result1['未付款订单数'] = df['订单编号'][df.订单付款时间.isnull()].count()#存入数据
result1['已完成订单数']=  df['订单编号'][df.订单付款时间.notnull()].count()
result1['总订单数'] = df['订单编号'].count()
result1['退款订单数'] = df['订单编号'][df.退款金额>0].count()
result1['总订单金额'] = df['总金额'].sum()
result1['总退款金额'] = df['退款金额'].sum()
result1['总实际收入金额'] = df['买家实际支付金额'][df.订单付款时间.notnull()].sum()
result1import numpy as np
table = pd.DataFrame(result1,index = np.arange(1))#把7个变量放入二维表中
table#统计地区订单量,以柱状图显示
import matplotlib.pyplot as pltresult2 = df[df.订单付款时间.notnull()].groupby('收货地址')['订单编号'].size()
#to_dict()直接把Series和DataFrame转成字典,tolist()转换成列表
result21 = result2.to_dict()
#esult21.keys()
result22 = sorted(result21.items(),key = lambda item:item[1]) #排序之后是列表result23 = {}
for i in range(len(result22)):result23[result22[i][0]] = result22[i][1]
result23#排序之后字典result24 = []
for j in result23.keys():result24.append(j)
#result22#把地址转换为列表形式
[list(x) for x in result22]
#plt.rcParams['font.family'] = ['SimHei']#设置中文正常显示
#plt.rcParams['axes.unicode_minus'] = False#设置符号正常显示#fig = plt.figure(figsize=(12,10)) #设置画布大小
#plt.barh(range(1,len(result23)+1),result23.values(),tick_label = list)
#plt.show()plt.rcParams['font.family'] = ['SimHei']#设置中文正常显示
plt.rcParams['axes.unicode_minus'] = False#设置符号正常显示fig = plt.figure(figsize=(12,10)) #设置画布大小
plt.barh(range(1,len(result23)+1),result23.values(),tick_label = list)
plt.show()from pyecharts import options as opts #全局配置项
from pyecharts.charts import Map #导入地图
mapDD = (Map().add('订单量',[list(x) for x in result22],'china').set_global_opts(title_opts=opts.TitleOpts(title='地区订单分布'),visualmap_opts=opts.VisualMapOpts(max_=2000))
)
mapDD.render('html\\mapDD.html')#分析订单走势
df.info()df['订单创建时间'] = pd.to_datetime(df['订单创建时间'])
df['订单付款时间'] = pd.to_datetime(df['订单付款时间'])result3 = df.groupby(df['订单创建时间'].apply(lambda x:x.strftime("%Y-%m-%d")))['订单编号'].size()
result31 = result3.to_dict()
fig = plt.figure(figsize=(30,10)) #设置画布大小
plt.plot(result31.keys(),result31.values())
plt.show分析:从图上来看,2月份上半月受新冠疫情的影响,订单量比较少,随着复工开幕,下半月订单量增长明显df.info()#9
result4=df.groupby(df['订单创建时间'].apply(lambda x:x.strftime("%H")))['订单编号'].size().to_dict()
#list(result4.keys())
[*result4.keys()]from pyecharts import options as opts #全局配置项
from pyecharts.charts import Map,Bar #导入地图barDD = (Bar().add_xaxis(list(result4.keys())).add_yaxis("订单量",list(result4.values())).set_global_opts(title_opts=opts.TitleOpts(title="每小时订单走势"))
)
#barDD.render_notebook()
barDD.render('html\\barDD.html')结论:从每小时订单量走势来看,一天中有3个高峰期(10点、15点、21点),其中21点-22点之间是一天中订单量最多
的时候,这个结果和之前1亿条淘宝用户行为数据分析的是一致的,对于卖家的指导意义就是,为了提高订单量,高峰
期时应该尽量保证客服的回复速度,尤其是晚上21点-22点之间,所以很多做电商的基本都有夜班

TianMao订单数据分析相关推荐

  1. SSAS知识回放之订单数据分析

    SSAS知识回放之订单数据分析 1:目标 基于已经做好的DW,利用SSAS实现一个多维数据模型的创建,通过浏览可以简单的实现订单数据的分析 2:步骤 2.1:添加数据源 如下图所示,创建一个数据仓库层 ...

  2. 实战项目:餐厅订单数据分析:订单维度和时间维度

    餐厅订单数据分析:订单维度和时间维度 1. 针对不同维度进行数据分析: 针对订单order_id: 什么菜最受欢迎 点菜的种类 点菜的数量 消费金额最大 平均消费 针对时间日期进行分析: 点菜量比较集 ...

  3. 基于Python进行餐饮订单数据分析

    Python数据分析----餐饮订单数据分析 题目要求 (以图片展示) 前言 俗话说的民意食为天,随着科技的发展和人们生活水平的提高.餐饮行业作为我国第三产业中的一个传统服务性行业,始终保持着旺盛的增 ...

  4. 冰箱日订单数据分析报告(京东)

    数据来源 2020年5月25日京东大家电-家用电器-冰箱订单数据,按10%抽样,约22MB(70k+条数据) 订单数据分析的基本思路 宏观分析 宏观把握订单的总体特征 订单总量:61535 GMV:6 ...

  5. python项目--餐厅订单数据分析

    导入包,加载数据 数据是网上获取的,数据见链接: 餐厅订单数据分析的数据. 通过分析之后我们要用到以下三个包,分别是numpy.pandas.matplotlib.加载数据我们采用pandas中的re ...

  6. 数据分析:餐厅订单数据分析

    数据分析:餐厅订单数据分析 作者:i阿极 作者简介:Python领域新星作者.多项比赛获奖者:博主个人首页

  7. python 京东_Python数据分析-京东订单数据分析实战

    本次数据来源于京东,类目为大家电-家用电器-冰箱,抽取2020年5月25日10%数据,数据量为 70k+,在 jupyer notebook 内进行分析. 数据文件: 链接:迅雷云盘:提取码:ezQq ...

  8. Python数据分析实战 —— 天猫订单数据分析

    文章目录 项目介绍 数据介绍 导入部分库 数据预处理 数据格式整理 异常值分析 数据分析 描述性统计 周趋势.日趋势分析 产品价格分析 地区分析 转化率分析 总结 项目介绍 本项目将对2020年2月份 ...

  9. python盘点订单_在线超市-Ulabox订单数据分析(python)

    摘要 本次实践案例利用数据kaggle数据进行分析.链接如下 该数据集为西班牙在线杂货店Ulabox订单数据,数据集包括匿名的子集30K订单从2017年开始的所有类型的客户.整个分析分为五个步骤:&q ...

  10. 2023年泰迪杯数据挖掘挑战赛B题--产品订单数据分析与需求预测(1.数据处理)

    1. 前言 本题相对来说比较适合新手,包括针对数据的预处理,数据分析,特征提取以及模型训练等多个步骤,完整的做下来是可以学到很多东西的. 2.问题一思路分析 本题要求利用附件中的训练数据进行深入的分析 ...

最新文章

  1. 「工科神器」MATLAB风波未平,「化学神器」ChemOffice再爆清查国内盗版行为
  2. 搭建Ubuntu下c/c++编译环境【转】
  3. 数据预处理(part1)--单个预测变量数据变换R语言
  4. 深入理解构造函数和原型链
  5. python爬虫加强版!!!!想爬哪个队伍就爬那个
  6. matlab 及数字信号实验报告,Matlab数字信号处理实验报告.doc
  7. 【CCF - 202009-1】称检测点查询 c语言
  8. 吞剑!喷火!这种江湖卖艺套路能吸引观众吗?
  9. 如何做一个基于微信小说小程序系统毕业设计毕设作品
  10. 网易游戏大咖分享——游戏行业职位发展(上)
  11. 使用pyaudio播放无损音乐(wav)
  12. 前序遍历+中序遍历重建二叉树
  13. [APIO2009]采油区域 题解
  14. Spark-000讲:What is Spark ?
  15. python计算圆周率100万位要多久_python圆周率计算小程序(非常慢)
  16. 数字黑洞C++ 程序设计,数字黑洞6174,你懂了吗
  17. 如何在微软官网查询WHQL认证的产品
  18. 双十一品牌——官方首度揭秘设计全过程!
  19. 直线方程的点斜式、两点式、斜截式的公式是什么
  20. CSS FIXED porn javhd

热门文章

  1. 工业物联网快速解决方案
  2. 关于安装ANACONDA遇到的无法定位动态链接库问题
  3. CDP营销方案 不仅仅是数据整合
  4. IE兼容模式文件上传所遇问题解决
  5. 解读一淘网(etao)首页响应式兼容ie6~ie8实现方法
  6. Revisit Knowledge Distillation: a Teacher-free Framework
  7. 在word中选择所有匹配查找内容的文档内容
  8. JS设计模式 - 单例模式
  9. 群晖套件 Transmission 汉化
  10. 解决word模板目录域更新失败的问题