示例统计销售榜品牌及销售额

importpandas as pdimportnumpy as npimportos

os.chdir('F:\\50mat\源数据1000张表格')

name= '户外服装&滑雪衣.xlsx'df=pd.read_excel(name)

df.head()

打印结果

日期转化率访客数三级类目客单价品牌

02019-080.036466837滑雪衣3887.646034品牌-5

12019-080.0061109951滑雪衣1890.920192品牌-7

22019-080.00827911067滑雪衣1001.541028品牌-19

32019-080.00364725296滑雪衣986.192182品牌-17

42019-080.0060125053滑雪衣2818.957816品牌-14

df['日期'].unique()

打印结果

array(['2019-08', '2019-07', '2019-06', '2019-05', '2019-04', '2019-03',

'2019-02', '2019-01', '2018-12', '2018-11', '2018-10', '2018-09'],

dtype=object)

一:操作单表

销售额

df['销售额'] = df['访客数'] * df['转化率'] * df['客单价']

df.head()

打印结果

日期转化率访客数三级类目客单价品牌销售额

02019-080.036466837滑雪衣3887.646034品牌-5118657.898127

12019-080.0061109951滑雪衣1890.920192品牌-7114977.898920

22019-080.00827911067滑雪衣1001.541028品牌-1991761.540049

32019-080.00364725296滑雪衣986.192182品牌-1790969.935091

42019-080.0060125053滑雪衣2818.957816品牌-1485634.834594

二:汇总销售额

#汇总销售额

df_sum= df.groupby('品牌')['销售额'].sum().reset_index()

df_sum.head()

打印结果

品牌销售额

0品牌-15.479539e+06

1品牌-102.913271e+06

2品牌-112.298716e+06

3品牌-122.821199e+06

4品牌-133.256508e+06

添加行业标签

#添加行业标签

df_sum['行业'] = name.replace('.xlsx','')

df_sum.head()

打印结果

品牌销售额行业

0品牌-15.479539e+06户外服装&滑雪衣

1品牌-102.913271e+06户外服装&滑雪衣

2品牌-112.298716e+06户外服装&滑雪衣

3品牌-122.821199e+06户外服装&滑雪衣

4品牌-133.256508e+06户外服装&滑雪衣

三:操作所有表格

importtime

start=time.time()

result=pd.DataFrame()for name inos.listdir():

df=pd.read_excel(name)

df['销售额'] = df['访客数'] * df['转化率'] * df['客单价']

df_sum= df.groupby('品牌')['销售额'].sum().reset_index()

df_sum['行业标签'] = name.replace('.xlsx','')

result=pd.concat([result,df_sum])

final= result.groupby('品牌')['销售额'].sum().reset_index().sort_values('销售额', ascending =False)

end=time.time()print('操作用时:{}s'.format(end-start))

操作用时:6.295360088348389s

#将科学计算法,改为两位小数

pd.set_option('display.float_format', lambda x :'%.2f' %x)print(final.head())

final.describe()

打印结果

品牌 销售额

15 品牌-5 1226223640.73

8 品牌-17 1195280571.60

2 品牌-11 1151829215.73

4 品牌-13 1150687029.66

3 品牌-12 1143519788.23

销售额

count20.00

mean1084854125.76

std63774592.90

min979272391.61

25%1050719265.66

50%1071804742.94

75%1118990465.22

max1226223640.73

七:数据分析模型

#表格处理示例:销售榜品牌及销售额

importpandas as pdimportnumpy as npimportosimporttime

os.chdir('F:\\50mat\源数据1000张表格')

name= '户外服装&滑雪衣.xlsx'df=pd.read_excel(name)

result=pd.DataFrame()for name inos.listdir():

df=pd.read_excel(name)

df['销售额'] = df['访客数'] * df['转化率'] * df['客单价']

df_sum= df.groupby('品牌')['销售额'].sum().reset_index()

df_sum['行业标签'] = name.replace('.xlsx','')

result=pd.concat([result,df_sum])

final= result.groupby('品牌')['销售额'].sum().reset_index().sort_values('销售额', ascending =False)#将科学计算法,改为两位小数

pd.set_option('display.float_format', lambda x :'%.2f' %x)print(final.head(10))

加油:一只阿木木

python批量分析表格_示例python 批量操作excel统计销售榜品牌及销售额相关推荐

  1. python批量分析表格_老板让我从几百个Excel中查找数据,我用Python一分钟搞定!...

    以下文章来源: 早起Python 作者:陈熹 大家好,又到了Python办公自动化系列. 今天分享一个真实的办公自动化需求,大家一定要仔细阅读需求说明,在理解需求之后即可体会Python的强大! 一. ...

  2. python批量分析表格_python批量设置多个Excel文件页眉页脚的脚本

    python批量设置多个Excel文件页眉页脚的脚本 本文实例为大家分享了python批量设置多个Excel文件页眉页脚的具体代码,供大家参考,具体内容如下 import os import open ...

  3. python批量分析表格_Python统计分析execl文件列表值的方法

    用Python统计分析execl文件列表值的方法,采用python批量统计分析Excel表格数据工具代码编写示例.Python实现文件操方法有很多,python excel处理数据简洁方便. 下边关于 ...

  4. python批量生成图_利用Python批量生成任意尺寸的图片

    实现效果 通过源图片,在当前工作目录的/img目录下生成1000张,分别从1*1到1000*1000像素的图片. 效果如下: 目录结构 实现示例 # -*- coding: utf-8 -*- imp ...

  5. python 批量创建线程_【Python】批量创建线程

    在<[Python]线程的创建.执行.互斥.同步.销毁>(点击打开链接)中介绍了Python中线程的使用,但是里面线程的创建,使用了很原始的方式,一行代码创建一条.其实,Python里是可 ...

  6. python 内存分析工具_[转] python运行时内存分析工具meliae

    meliae是一个python进程内存占用监控.分析工具,它的安装需要依赖pyrex包. 一.安装: 安装python内存分析工具 sudo pip install cython sudo pip i ...

  7. python批量移动文件_用python批量移动文件

    我是用来移动图片的,其他格式的文档也是可以的,改下后缀列表就可以了 import os,shutil import datetime #将文件夹里的图片全部移动到新文件夹中 #revised by S ...

  8. python批量打印网页_用Python批量打印定制的HTML页面

    让我提供一些背景知识. 我自愿参加的一个组织为那些在假期不能来取餐的人送饭. 他们目前有一个sqlserverdb,该数据库存储所有客户机的信息以及每年的用餐信息. 目前,一个Java桌面应用程序连接 ...

  9. 使用python处理wps表格_用python写wps的excel文件 | 学步园

    参考了网上的一些帖子,试了一下用python写wps的excel文件(需要windows操作系统,安装了wps的表格处理程序,安装了pywin32)--我安装的是WPS个人版,可以免费使用的. imp ...

最新文章

  1. ubuntu 客户端ssh连接服务器速度缓慢
  2. 基于STC8H8K64U声音信标采集和处理算法
  3. 第五人格维修服务器时间,第五人格调整维护时间 第五人格新赛季奖励皮肤一览...
  4. 身上的WZSZF01重担开始减轻
  5. 风吹来_“秃如其来”的年轻人,如何才能让头发“春风吹又生”?
  6. CodeSmith使用存档
  7. 程序员代码面试指南第二版 8.单调栈结构(普通及进阶)
  8. 2019每特教育蚂蚁课堂-Java互联网微服务架构面试宝典v1
  9. 码农小汪-Java Condition
  10. QQ空间相册批量下载qq相册批量下载专家比骨头小林还厉害
  11. visio2013画图时两条直线交叉, 如何让它不弯曲
  12. 框架-Laraver
  13. 一只纯白小菜鸡是如何走上嵌入式学习这条道路的
  14. 正则表达式元字符 和限定字符
  15. cadence 16.60破解方式及文件下载地址
  16. (资讯)华为员工利用Bug越权访问机密卖给第三方,获利1.6万元,被判有期徒刑一年
  17. AI相机,请把我拍成“Angelababy ”!
  18. 清华大学公开课线性代数2——第8讲:图和网络
  19. *grep -F/f的作用*
  20. C++ 强制转换运算符

热门文章

  1. python爬虫详细步骤-Python爬虫的步骤和工具
  2. 小学生学python-小学生都学Python了,你还不知道如何开始
  3. python爬虫教程视频-13天搞定Python分布爬虫
  4. Vmware虚拟机安装Ubuntu 16.04 LTS(长期支持)版本+VMware tools安装
  5. es中发现结点的角色
  6. LeetCode 452 Minimum Number of Arrows to Burst Balloons(贪心法)
  7. LeetCode Flatten Nested List Iterator(栈)
  8. spoj16935 Straight Line Spiral Pattern (Act 3)
  9. 1_itemtele
  10. Analysis of the Clustering Properties of the Hilbert Space-Filling Curve 论文笔记