python批量分析表格_示例python 批量操作excel统计销售榜品牌及销售额
示例统计销售榜品牌及销售额
importpandas as pdimportnumpy as npimportos
os.chdir('F:\\50mat\源数据1000张表格')
name= '户外服装&滑雪衣.xlsx'df=pd.read_excel(name)
df.head()
打印结果
日期转化率访客数三级类目客单价品牌
02019-080.036466837滑雪衣3887.646034品牌-5
12019-080.0061109951滑雪衣1890.920192品牌-7
22019-080.00827911067滑雪衣1001.541028品牌-19
32019-080.00364725296滑雪衣986.192182品牌-17
42019-080.0060125053滑雪衣2818.957816品牌-14
df['日期'].unique()
打印结果
array(['2019-08', '2019-07', '2019-06', '2019-05', '2019-04', '2019-03',
'2019-02', '2019-01', '2018-12', '2018-11', '2018-10', '2018-09'],
dtype=object)
一:操作单表
销售额
df['销售额'] = df['访客数'] * df['转化率'] * df['客单价']
df.head()
打印结果
日期转化率访客数三级类目客单价品牌销售额
02019-080.036466837滑雪衣3887.646034品牌-5118657.898127
12019-080.0061109951滑雪衣1890.920192品牌-7114977.898920
22019-080.00827911067滑雪衣1001.541028品牌-1991761.540049
32019-080.00364725296滑雪衣986.192182品牌-1790969.935091
42019-080.0060125053滑雪衣2818.957816品牌-1485634.834594
二:汇总销售额
#汇总销售额
df_sum= df.groupby('品牌')['销售额'].sum().reset_index()
df_sum.head()
打印结果
品牌销售额
0品牌-15.479539e+06
1品牌-102.913271e+06
2品牌-112.298716e+06
3品牌-122.821199e+06
4品牌-133.256508e+06
添加行业标签
#添加行业标签
df_sum['行业'] = name.replace('.xlsx','')
df_sum.head()
打印结果
品牌销售额行业
0品牌-15.479539e+06户外服装&滑雪衣
1品牌-102.913271e+06户外服装&滑雪衣
2品牌-112.298716e+06户外服装&滑雪衣
3品牌-122.821199e+06户外服装&滑雪衣
4品牌-133.256508e+06户外服装&滑雪衣
三:操作所有表格
importtime
start=time.time()
result=pd.DataFrame()for name inos.listdir():
df=pd.read_excel(name)
df['销售额'] = df['访客数'] * df['转化率'] * df['客单价']
df_sum= df.groupby('品牌')['销售额'].sum().reset_index()
df_sum['行业标签'] = name.replace('.xlsx','')
result=pd.concat([result,df_sum])
final= result.groupby('品牌')['销售额'].sum().reset_index().sort_values('销售额', ascending =False)
end=time.time()print('操作用时:{}s'.format(end-start))
操作用时:6.295360088348389s
#将科学计算法,改为两位小数
pd.set_option('display.float_format', lambda x :'%.2f' %x)print(final.head())
final.describe()
打印结果
品牌 销售额
15 品牌-5 1226223640.73
8 品牌-17 1195280571.60
2 品牌-11 1151829215.73
4 品牌-13 1150687029.66
3 品牌-12 1143519788.23
销售额
count20.00
mean1084854125.76
std63774592.90
min979272391.61
25%1050719265.66
50%1071804742.94
75%1118990465.22
max1226223640.73
七:数据分析模型
#表格处理示例:销售榜品牌及销售额
importpandas as pdimportnumpy as npimportosimporttime
os.chdir('F:\\50mat\源数据1000张表格')
name= '户外服装&滑雪衣.xlsx'df=pd.read_excel(name)
result=pd.DataFrame()for name inos.listdir():
df=pd.read_excel(name)
df['销售额'] = df['访客数'] * df['转化率'] * df['客单价']
df_sum= df.groupby('品牌')['销售额'].sum().reset_index()
df_sum['行业标签'] = name.replace('.xlsx','')
result=pd.concat([result,df_sum])
final= result.groupby('品牌')['销售额'].sum().reset_index().sort_values('销售额', ascending =False)#将科学计算法,改为两位小数
pd.set_option('display.float_format', lambda x :'%.2f' %x)print(final.head(10))
加油:一只阿木木
python批量分析表格_示例python 批量操作excel统计销售榜品牌及销售额相关推荐
- python批量分析表格_老板让我从几百个Excel中查找数据,我用Python一分钟搞定!...
以下文章来源: 早起Python 作者:陈熹 大家好,又到了Python办公自动化系列. 今天分享一个真实的办公自动化需求,大家一定要仔细阅读需求说明,在理解需求之后即可体会Python的强大! 一. ...
- python批量分析表格_python批量设置多个Excel文件页眉页脚的脚本
python批量设置多个Excel文件页眉页脚的脚本 本文实例为大家分享了python批量设置多个Excel文件页眉页脚的具体代码,供大家参考,具体内容如下 import os import open ...
- python批量分析表格_Python统计分析execl文件列表值的方法
用Python统计分析execl文件列表值的方法,采用python批量统计分析Excel表格数据工具代码编写示例.Python实现文件操方法有很多,python excel处理数据简洁方便. 下边关于 ...
- python批量生成图_利用Python批量生成任意尺寸的图片
实现效果 通过源图片,在当前工作目录的/img目录下生成1000张,分别从1*1到1000*1000像素的图片. 效果如下: 目录结构 实现示例 # -*- coding: utf-8 -*- imp ...
- python 批量创建线程_【Python】批量创建线程
在<[Python]线程的创建.执行.互斥.同步.销毁>(点击打开链接)中介绍了Python中线程的使用,但是里面线程的创建,使用了很原始的方式,一行代码创建一条.其实,Python里是可 ...
- python 内存分析工具_[转] python运行时内存分析工具meliae
meliae是一个python进程内存占用监控.分析工具,它的安装需要依赖pyrex包. 一.安装: 安装python内存分析工具 sudo pip install cython sudo pip i ...
- python批量移动文件_用python批量移动文件
我是用来移动图片的,其他格式的文档也是可以的,改下后缀列表就可以了 import os,shutil import datetime #将文件夹里的图片全部移动到新文件夹中 #revised by S ...
- python批量打印网页_用Python批量打印定制的HTML页面
让我提供一些背景知识. 我自愿参加的一个组织为那些在假期不能来取餐的人送饭. 他们目前有一个sqlserverdb,该数据库存储所有客户机的信息以及每年的用餐信息. 目前,一个Java桌面应用程序连接 ...
- 使用python处理wps表格_用python写wps的excel文件 | 学步园
参考了网上的一些帖子,试了一下用python写wps的excel文件(需要windows操作系统,安装了wps的表格处理程序,安装了pywin32)--我安装的是WPS个人版,可以免费使用的. imp ...
最新文章
- ubuntu 客户端ssh连接服务器速度缓慢
- 基于STC8H8K64U声音信标采集和处理算法
- 第五人格维修服务器时间,第五人格调整维护时间 第五人格新赛季奖励皮肤一览...
- 身上的WZSZF01重担开始减轻
- 风吹来_“秃如其来”的年轻人,如何才能让头发“春风吹又生”?
- CodeSmith使用存档
- 程序员代码面试指南第二版 8.单调栈结构(普通及进阶)
- 2019每特教育蚂蚁课堂-Java互联网微服务架构面试宝典v1
- 码农小汪-Java Condition
- QQ空间相册批量下载qq相册批量下载专家比骨头小林还厉害
- visio2013画图时两条直线交叉, 如何让它不弯曲
- 框架-Laraver
- 一只纯白小菜鸡是如何走上嵌入式学习这条道路的
- 正则表达式元字符 和限定字符
- cadence 16.60破解方式及文件下载地址
- (资讯)华为员工利用Bug越权访问机密卖给第三方,获利1.6万元,被判有期徒刑一年
- AI相机,请把我拍成“Angelababy ”!
- 清华大学公开课线性代数2——第8讲:图和网络
- *grep -F/f的作用*
- C++ 强制转换运算符
热门文章
- python爬虫详细步骤-Python爬虫的步骤和工具
- 小学生学python-小学生都学Python了,你还不知道如何开始
- python爬虫教程视频-13天搞定Python分布爬虫
- Vmware虚拟机安装Ubuntu 16.04 LTS(长期支持)版本+VMware tools安装
- es中发现结点的角色
- LeetCode 452 Minimum Number of Arrows to Burst Balloons(贪心法)
- LeetCode Flatten Nested List Iterator(栈)
- spoj16935 Straight Line Spiral Pattern (Act 3)
- 1_itemtele
- Analysis of the Clustering Properties of the Hilbert Space-Filling Curve 论文笔记