6. 批量处理分析数据
需求
:有20个品牌共生产了127个类目的产品,筛选出近一年销售额总额TOP5的品牌
以及对应的销售额。
思路
:先做第一个然后如法炮制将结果汇总即可。
数据信息如下:
加载数据:
接着,是要汇总不同品牌在这个细分行业下的销售额,我们要汇总的是各品牌近一年(2018年9月-2019年8月)的销售额,先看看日期是否正确:
每个品牌每个月份销售额计算如下:
按照品牌分组计算销售额总和前五的品牌:
这里有个细节,最终要汇总的是所有细分行业的销售额top5,给所属类别添加标签。
最终最终结果:
import time
start = time.time()
result = pd.DataFrame()
for name in os.listdir():df = pd.read_excel(name)df['销售额']= df['访客数']* df['转化率']*df['客单价']df_sum = df.groupby('品牌',)['销售额'].sum().reset_index()df_sum['类目'] = name.replace(".xlsx","")result = pd.concat([result,df_sum])
final = result.groupby('品牌')['销售额'].sum().reset_index().sort_values('销售额',ascending=False)
final.head()
看起来很奇怪的销售额,是pandas自作主张把实际销售额变成了 科学记数法 形式来展示,要还原数值,需要更改一下原始的设置:
总结
本文以一个简单又复杂的场景切入,简单是需求本身非常简单,而复杂则是基础数据涉及到的表格多而杂。代码和逻辑本身浅显易懂,主要为了抛出一块砖,敲开批量处理表格的思维藩篱,以引出同志们实践中,在合适场景下用Python来化繁为简的玉。核心是分析出逻辑思维然后逐步细化
。
参考
提取码:7kyt
6. 批量处理分析数据相关推荐
- Oracle10表数据编辑器,Oracle ORACLE 快速批量导入文本数据到数据库(sqlldr工具)方法与分析 (Windows CMD 方式)...
Oracle ORACLE 快速批量导入文本数据到数据库(sqlldr工具)方法与分析 (Windows CMD 方式) 在实际生产环境中,常会碰到将一些如通过通讯接口传过来的数据(文本文件 txt) ...
- 单基因gsea_又是神器!基于单基因批量相关性分析的GSEA
有这样的使用场景么? 1.已经确定研究的基因,但是想探索他潜在的功能,可以通过跟这个基因表达最相关的基因来反推他的功能,这种方法在英语中称为guilt of association,协同犯罪. 2.我 ...
- 批量下载ERA5数据(Python+IDM)
本文介绍了如何通过Python脚本和Internet Download Manager(IDM)软件批量下载ERA5数据. 1. ERA5数据简介 ERA5是第五代ECMWF大气再分析全球气候数据,该 ...
- 使用python批量下载天猫数据并进行合并(非爬虫)
使用python批量下载天猫数据并进行合并(非爬虫) 做电商运营少不了数据分析支持,无论是选品.选关键词.研究竞品还是开直通车.店铺引流都需要有数据支持.不过生意参谋虽然强大,但现在都只能显示&quo ...
- 生信分析R语言助力作图----单基因批量相关性分析
单基因批量相关性分析 嘻嘻嘻~~~,晚上秒变生信分析小白,一个游走在生物学和计算机变成之间的小白,享受着里面的快乐和痛苦.不停的挣扎,不停的成长,多学习,多尝试,一定会有意想不到的收获.加油!!! 首 ...
- Surv单因素批量生存分析使用 cox批量生存回归分析有点像deseq2的design差异分析designG:\r\2021_1203_geo\GEO-master\GSE11121_survival
批量生存分析 input codes output input: 表达矩阵 和 meta 信息 表达矩阵 meta信息 phe = as.data.frame(apply(phe,2,as.numer ...
- Python批量采集商品数据并使用多线程(含完整源码)
前言 嗨喽,大家好,这里是魔王~ 本次目的: Python批量采集商品数据 知识点: 爬虫基本流程 非结构化数据解析 csv数据保存 线程池的使用 开发环境: python 3.8 pycharm r ...
- word(2010)宏使用-批量提取word数据
word 2010 宏的使用 Word中对宏的定义 Word宏的优缺点 Word宏运用实例---批量提取word数据 结语 Word中对宏的定义 Microsoft Word中对宏定义为:" ...
- 2022爱分析· 数据智能厂商全景报告
报告编委 黄勇 爱分析合伙人&首席分析师 孟晨静 爱分析高级分析师 李冬露 爱分析分析师 冯怡欣 爱分析分析师 兰壹凡 爱分析分析师 目录 \1. 研究范围定义 \2. 厂商全景地图 \3. ...
最新文章
- 你朋友圈里的广告是怎么做到合你胃口的?
- 人脸识别损失函数笔记
- iterparse中的events参数start和end的用法
- 百度地图 js 在安卓端手指缩放无效_利用百度地图绘制3D轨迹演示
- @总结 - 4@ 多项式的多点求值与快速插值
- Java 9 –终极功能列表
- 前端学习(768):构造对象与对象区别
- php 依赖注入框架,依赖注入模式(Dependency Injection)
- JS实现将所有超链接指向同一个页面地址
- 点击按钮重新加载ajax,Jquery AJAX点击链接,然后重新加载页面
- Python编程练习:使用 turtle 库完成六边形的绘制
- 【纯干货】4年前想解决的事情,今天才实验成功
- Linux中使用Vim快速更换文档中Windows换行符为Linux平台
- python 大智慧自定义数据_大智慧自定义指数
- 质量提高90%以上,智能化施工为高铁建设提速增效
- PHP爬虫之phpspider
- 跨越opengl和d3d的鸿沟(四):完结篇,平台和未来
- java web安全框架_7.1 SpringSecurity安全框架
- 阿里云ODPS升级为一体化大数据平台 满足用户多元化数据计算需求
- 创意库|Photoshop超跑汽车海报设计实例