大家好,我是菜鸟哥!

最近有不少粉丝问我关于Python批量操作Excel的问题。

大家的关注点主要是如何循环遍历表格、如何用Pandas批量处理,当然,还有在996的压迫下如何提效(来挤出更多摸鱼时间)。

为此,我特意肝了几天,用基于实际业务的脱敏数据,以完整小项目的形式,来集中解决这些问题。

我的Pandas实战系列老传统,完整案例代码和数据源,已经打包好放在文末,顺便剧透文末还有送书活动。

项目背景

不吹牛集团这几年孵化了50个品牌,在各渠道做了大量品宣层面的曝光。现在集团首席吹牛官提了两个需求:

1. 要一张大表,包含每个月搜索人数TOP5的品牌相关数据,以及对应品牌在当月的搜索份额和排名。

2. 在现有数据基础上,找到最近一年投放效果还不错的品牌,要吹吹牛,做年度表彰。

这是小z特别准备的两个具有代表性的需求:

  • 第一种:业务方已经定好了条条框框,需要数据分析师做的是取数和处理的工作,这样的“分析”工作,坑往往在于取数和清洗的复杂性。

  • 第二种:业务方自己想了个模糊的方向,需要分析师结合实际数据,定逻辑,给建议。

数据预览

话音未落,集团首席吹牛官的跟屁虫就把相关源数据丢过来了

一共24张Excel表格,按月存储,涵盖了从2019年1月到2020年12月的数据。

表格内部数据大同小异:

注:点击人数和支付人数,都是在搜索人数基础上统计的

每张表都有50个品牌,包括了品牌名、品牌搜索人数、点击人数和对应的支付人数这几个关键字段。

源数据就是这样简简单单中又透漏着麻麻烦烦,接下来,我们就开始手撕需求。

项目一:Python批量操作

开始动手前,我们要明确需求。

再回顾一下首席吹牛官的第一个需求:要一张大表,包含每个月搜索人数TOP5品牌的相关数据,以及对应品牌在当月的搜索份额和排名。

提炼:在现有源数据的基础上,我们还需要对各品牌月内按搜索人数排序,然后计算每个品牌搜索份额,取其前5,最后遍历汇总。

自动化之哥曾经说过:Python批量操作Excel,无论表格再多,处理逻辑再复杂,只要我们集中力量击破一张,就能够实现批量操作的全面胜利。

首先,我们要解决的是单张表的问题。

按搜索人数排序:

调用rank快速给到对应的排名:

再来计算搜索份额,搜索份额的计算公式:单品牌搜索人数/所有品牌搜索人数汇总,用Pandas计算,怎一个easy了的!

正当我们准备批量执行操作,首席吹牛官发来了消息:

“需求一略有调整,投资人最关注的是凌云这个品牌,要求在汇总表中,每个月凌云品牌的相关指标排在最前面,后面跟着搜索排名TOP5的品牌”。

具体排名逻辑如图所示:

面对需求的临时改动,见过大风大浪的我们内心没有一丝波澜,甚至还有一点想笑。小事一桩,改改Pandas逻辑就好了。

先找到目标品牌凌云:

再按照顺延的逻辑,定位TOP5品牌相关数据:

合并即可获取我们想要的结果:

单表操作完成,批量操作,只需要建立好循环+合并关系,并引入日期列,在合并结果中对不同的表数据做好区分:

result = pd.DataFrame()for name in os.listdir():df = pd.read_excel(name)df = df.sort_values('品牌搜索人数',ascending = False)df['搜索人数排名'] = df['品牌搜索人数'].rank(ascending = False)df['搜索份额'] = df['品牌搜索人数'] / df['品牌搜索人数'].sum()brand = '凌云'brand_data = df.loc[df['品牌'].str.find(brand) != -1,:]other = df.loc[df['品牌'].str.find(brand) == -1,:]other_top5 = other.iloc[:5,:]data = pd.concat([brand_data,other_top5])data['日期'] = name[4:-5]result = pd.concat([result,data])

Pandas批量操作,就是如此丝滑~

第一个需求搞定。

项目二:品牌投放分析

还记得那个明(che)确(dan)的需求二吗?

“在现有数据基础上,找到最近一年投放效果还不错的品牌,要吹吹牛,做年度表彰。”

首席吹牛官以成本数据过于机密为由,除了说各品牌费用基本无差别之外,没有透露任何关于成本方面的数据,我们自然也无法计算投放ROI了这些核心指标了。

目前能够拿到的,只有品牌、搜索人数、点击人数和对应支付人数这几个指标。

要找到最近一年投放效果还不错的品牌,我们可以用漏斗思维,从量级(人数)和效率(转化率)两个角度来考虑:

在费用无差别的情况下:

  • 人群基数大(搜索人数),表示投放的心智效果不错,让更多用户被广告触达后,在平台主动搜相关的品牌。

  • 搜索-点击转化率高,代表了搜索结果的精准度,搜索后展示页面的吸引力等等

  • 点击-支付转化率高,更可能受产品详情页面、活动力度等影响

在项目二场景中,三个指标越高越好。接下来,我们就结合搜索人数,搜索-点击转化率和点击-支付转化率,用Pandas做一波分析。

要对最近一年的数据做分析,我们先把2020年所有数据合并,拿到汇总表:

再按品牌的维度,做指标汇总:

计算对应的搜索-点击转化率,点击-支付转化率:

基础数据齐活了!

从仅有的head5数据可以看到,双敏品牌以160万的搜索人数独占鳌头,但是!排名第二的九方,虽然搜索人数少了40多万,却能凭借较高的搜索-点击转化率和点击-支付转化率,在支付人数上远超双敏,成为支付之王。

表格太晦涩,我们画个图吧:

注:因为分析背景是无差别投放,搜索人数重要性非常高,为了可视化简洁清晰,我们简单粗暴的筛选TOP15品牌来绘图

气泡大小代表着品牌搜索人数量级

根据气泡图,我们按照搜索-点击转化率和点击-支付转化率的高低划分了4个区间:

  • 区间1:高搜索-点击转化,高点击-支付转化

  • 区间2:低搜索-点击转化,高点击-支付转化

  • 区间3:低搜索-点击转化,低点击-支付转化

  • 区间4:高搜索-点击转化,低点击-支付转化

再结合数据表,看的更加清晰:

结果显而易见,高搜索量级的品牌,主要呈现出两种形态:

  • 以双敏(排名第1)、巨奥(排名第3)为代表的品牌主要分布在第三区间,量级较大,但两种转化效率均需要进一步提升,品牌没能较好的承接蜂拥而至的流量。

  • 九方(排名第2)、商软(排名第4)则是高搜索量级、高转化效率的代表,从现有数据看,他们才是不吹牛集团学习的榜样。

正当我们准备把这一步结果同步给首席吹牛官,顺便探讨进一步的数据分析方向,比如结合支付人数的金额贡献、留存率、LTV,以及引入两年增速的维度,结合业务动作来定位深层原因。

没想到首席吹牛官发来了这样的消息:

“第二个需求我可能没说清楚,这次不仅是表彰,也是给融资机构秀肌肉的一部分,我们关注的只是品牌声量,对应的就是品牌搜索人数这个指标,你汇总好排个序就好”

我们每个人会说超过5种语言的脏话,但在这个场景,大部分人只能条件反射般的打出这8个字:

“嗯嗯,好的,马上给到”

实例故事告一段落,上述数据维度和验证角度,大家可以做更多的探索。

最后推荐一下我们的星球:由菜鸟学Python原班人马建了一个投资星球,汇聚一批喜欢投资的朋友一起分享投资的技巧,不限于基金,股票等其他品种,提高自己的财商,一起读书打卡,欢迎加入。推荐阅读:入门: 最全的零基础学Python的问题  | 零基础学了8个月的Python  | 实战项目 |学Python就是这条捷径干货:爬取豆瓣短评,电影《后来的我们》 | 38年NBA最佳球员分析 |   从万众期待到口碑扑街!唐探3令人失望  | 笑看新倚天屠龙记 | 灯谜答题王 |用Python做个海量小姐姐素描图 |碟中谍这么火,我用机器学习做个迷你推荐系统电影趣味:弹球游戏  | 九宫格  | 漂亮的花 | 两百行Python《天天酷跑》游戏!AI: 会做诗的机器人 | 给图片上色 | 预测收入 | 碟中谍这么火,我用机器学习做个迷你推荐系统电影小工具: Pdf转Word,轻松搞定表格和水印! | 一键把html网页保存为pdf!|  再见PDF提取收费! | 用90行代码打造最强PDF转换器,word、PPT、excel、markdown、html一键转换 | 制作一款钉钉低价机票提示器! |60行代码做了一个语音壁纸切换器天天看小姐姐!|年度爆款文案1).卧槽!Pdf转Word用Python轻松搞定!2).学Python真香!我用100行代码做了个网站,帮人PS旅行图片,赚个鸡腿吃3).首播过亿,火爆全网,我分析了《乘风破浪的姐姐》,发现了这些秘密 4).80行代码!用Python做一个哆来A梦分身 5).你必须掌握的20个python代码,短小精悍,用处无穷 6).30个Python奇淫技巧集 7).我总结的80页《菜鸟学Python精选干货.pdf》,都是干货 8).再见Python!我要学Go了!2500字深度分析!9).发现一个舔狗福利!这个Python爬虫神器太爽了,自动下载妹子图片点阅读原文,领廖雪峰资料!

太秀了!用Pandas秒秒钟搞定24张Excel报表,还做了波投放分析!相关推荐

  1. 用Pandas秒秒钟搞定24张Excel报表,还做了波投放分析!

    如何循环遍历表格.如何用Pandas批量处理,当然,还有在996的压迫下如何提效(来挤出更多摸鱼时间). 为此,我特意肝了几天,用基于实际业务的脱敏数据,以完整小项目的形式,来集中解决这些问题. 我的 ...

  2. 转换文档参数_明明2秒可以搞定Word、Excel相互转换,你却用了半小时!真亏了...

    我们在用office三件套工作的时候,经常都需要对文件的格式进行转换,像是Word文档和Excel表格的转换,很多小伙伴都要花上半个小时甚至以上的时间才能搞定,效率实在不行.别担心,今天小编将分享能快 ...

  3. fastnest怎么一键排版_我的妈呀!一键排版也太好用了吧!3秒钟搞定排版!

    原标题:我的妈呀!一键排版也太好用了吧!3秒钟搞定排版! 胖友们好,我是三儿 之前就老是有胖友问我 一键排版可不可以自己设置模板 你瞧这不就是来了 一键排版更新了! 先来看看更新前后的页面吧 更新前v ...

  4. 微信 语音转文字 java,微信语音转文字怎么操作?手把手教你,一秒钟搞定!

    原标题:微信语音转文字怎么操作?手把手教你,一秒钟搞定! ‍微信语音转文字怎么操作?相信多数人都知道微信有这样的功能,但真正操作起来不知道怎么做,也不知道能够适用于哪些场景.下面就来教大家手把手操作: ...

  5. 免费抠图神器!五秒在线搞定抠图

    第一款:remove.bg(2018年) 网站链接:Remove Background from Image – remove.bg 详细介绍参考:5秒自动抠图!可能是2018年最强大的去背景神器! ...

  6. 一文搞定Qt读写excel以及qt读写xml数据

    一文搞定Qt读写excel以及qt读写xml数据 最终的实现效果图 RC_ICONS = logo.ico .pro文件同级目录下加入 logo.ico 图标文件,运行文件,文件的图标就被写入软件 u ...

  7. bootstraptable导出excel独立使用_JavaWeb系列之-一小时搞定POI导出Excel

    课程简介: 课程目标:通过本视频,可以在一小时之内快速实现使用Apache POI组件导出excel,您是不是项目中用到这个功能了,是不是懒得从网上查代码改代码呢?这个简短的小视频适合您. 适用人群: ...

  8. 新款宝马MINI钥匙增加!轻松搞定,这MINI看着还可以噢

    新款宝马MINI钥匙增加!轻松搞定,这MINI看着还可以噢

  9. java读取word文档内容_合并多个Word文档内容,还在复制粘贴就out了,同事五秒轻松搞定...

    在我们工作中,我们经常会编写多个Word文档内容,那么怎么将多个单个的Word文档合并到一个文档中,这就会显得有些难度. 如上图所示,我们需要将三个不同的案例,快速的汇总到我们的案例汇总表当中.许多朋 ...

最新文章

  1. windows环境下跑hadoop自带的wordcount遇到的问题
  2. java sdf.parse_用DateFormat的parse方法验证字符串是否是日期的问题
  3. java dao层_JavaWeb Dao层架构设计
  4. 【运筹学】表上作业法 ( 示例 | 使用 “ 闭回路法 “ 计算检验数判定最优解 )
  5. 结构体定义容易混淆的地方
  6. 10-7 B2-1查找订单数最多的员工信息 (20 分)
  7. OpenFOAM安装+ParaView安装+环境配置(deb直接安装详细记录-Ubuntu14.04+OpenFOAM4.1)
  8. .NET Core 2.0 正式发布信息汇总
  9. 金山网络CEO傅盛:简约之美
  10. python 数字大小排序_python list字符按数字大小排序
  11. 2021年Q2服饰行业季度洞察报告
  12. Java案例:压缩与解压缩文件
  13. 原型模式(Prototype) 1
  14. Linux 抄袭 Unix ?今日终有定论!
  15. 机器学习笔记 - 使用Keras + Unet 进行图像分割
  16. itunes备份是整个手机备份吗_iTunes备份道理我都懂,但我依然不想备份的?
  17. 制作轮播切换效果html,原生JS实现图片轮播切换效果
  18. sap 双计量单位_SAP系统里批次双计量单位的实现
  19. ubuntu安装搜狗拼音输入法
  20. Vue 之 echarts 图表数据可视化的基础使用(简单绘制各种图表、地图)

热门文章

  1. python爬取论文全文数据_Python爬取微信公众号历史文章进行数据分析
  2. 计算机无法识别移动硬盘怎么办,电脑不能识别移动硬盘的原因 移动硬盘不识别怎么办...
  3. spm + host
  4. 【数据挖掘】主成分分析Python实现
  5. python存储JSON
  6. 计算机进去bios方式,电脑的BIOS在哪?各电脑进入BIOS的方法
  7. Linux系统裁剪summary
  8. LMDI 理论推导详解【从理论到Python-MATLAB实现(理论)】
  9. 发票管理系统java_企业发票管理系统.doc
  10. stm32正常运行流程图_stm32初始化流程图解析