为什么有的人工作任务越来越多,却不用加班。同样的分析到了你的手里,简直泰山压顶?“效率”二字要时刻放在心头。类似的处理做第二遍时就需要反思,有没有更简便、省时的方法?

01 分析任务

筛选商品1消费数量大于200 ,商品2消费数量大于200 且 商品1消费数量大于商品2消费数量 的用户,统计统计该部分用户商品3,商品4的各自总消费数量和平均消费数量。

数据长这样:

大部分人:

筛选商品1消费数量 > 200

筛选商品2消费数量 > 200

把筛选结果粘贴的另一张表格

对D列 或 E列排序

手工删除商品2消费数量小于等于商品1消费数量的行

统计商品3和商品4的总消费数量和平均消费数量

半个小时已过去

部分人:

在Excel加辅助列

写if公式

根据if公式结果筛选

统计商品3和商品4的总消费数量和平均消费数量

Binggo,3分钟不到就搞定。嗯,还不错。

第二天还需要统计一份相似新数据,还是3分钟。

02 思考

有没有可能把第二次的3分钟变成3秒钟?如果Excel的数据很大,有几十M,运算一次要卡很久怎么办?手工敲公式粘数据容易误操作,有没有解决的办法?

当然有,让我们继续看如何使用python做数据分析必用的包“pandas”把大象装进冰箱。

第一步:启动jupyter notebook,导入pandas。(不会第一步的小小白可以点击这里查看上一篇帖子)。

多啰嗦一句 as pd 是python引入的pandas包的简称,谁都不想每次敲6下键盘。

第二步:导入数据并查看

此处注意,我是在存有数据的目录中打开jupyter Notebook,所以只需要写文件名data.xlsx即可。

执行第二行后,数据已经存储在data变量中。

head()函数可以查看前5行。describe()函数可以统计每一列的计数、均值、标准差、最大最小值、以及几个分位值。

第三步:最重要的一步,在data上做筛选

让我再次把语句写一遍

data_filter = data[(data["商品1消费数量"]>200) & (data["商品2消费数量"]>200) & (data["商品1消费数量"]>data["商品2消费数量"])]

等号右边拆解来看:

data[“商品1消费数量”] > 200 : 含义是data数据中 商品1消费数量 这一列 的筛选条件,注意符号为英文。

& :且,商品1的消费数量大于200 且 商品2的消费数量大于200

多个条件需要用括号括起来,还是那句话“英文符号”

同样查看一下筛选后的结果“data_filter”

第四步:把结果保存到文件中

可以试试不加index = false的区别

第五步:统计商品3和商品4

注意:此处items存储了想筛选的列名,data_filter[items] 表示仅取items中存储的列。

axis = 0代表按列统计。

有的人会问,axis有没有其他值?有的,axis = 1 代表按行统计。pandas的axis设定会有点绕,目前先记下即可,后续文章会展开讲。

03 看效果的时候

当你再次遇到类似的统计,仅需修改导入的文件名,判断的条件,导出的文件名,然后点击Cell – Run all。仅需几秒,结果已出。

一天中至少3分钟已经被节约下来。时间如此宝贵,生命如此美好,多睡会觉,打打游戏,刷刷剧,不香吗?

下载示例文件:

链接:https://pan.baidu.com/s/1aiK_ObE0VdjmWhPUtQAjZQ

提取码:d5tg

下一篇文章讲用python – pyecharts包画一些Excel难以企及的统计图用我的经验为你铺路–小数

本文来自投稿,不代表小数-数据分析立场,如若转载,请注明出处:http://www.dataxx.net.cn/archives/2466

python怎么筛选excel数据_【In Action】工具-2-用Excel三分钟才能完成的复杂筛选,python十秒完成...相关推荐

  1. excel数据导入c语言数组,C导入Excel数据的方式(两种)

    C导入Excel数据的方式(两种) C#导入 Excel 数据的方式(两种) 方式一.导入数据到数据集对象,只支持 Excel 的标准格式,即不能合并单元格等等/// /// 导入数据到数据集中/// ...

  2. python怎么筛选excel数据_懂Excel也能轻松入门Python数据分析包pandas(二):高级筛选(上)-excel筛选...

    转发本文并私信我"python",即可获得Python资料以及各种心得(持续更新的) 系列文章: 前言 经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理 ...

  3. python怎么筛选excel数据_工具篇:EXCEL与python的对比 如何筛选数据.md

    工具篇:EXCEL与python的对比 如何筛选数据 第6章 数据筛选 使用与,或,非三个条件配合大于,小于和等于对数据进行筛选,并进行计数和求和. 与Excel中的筛选功能和countifs和sum ...

  4. 在excel中如何筛选重复数据_如何将Excel表中重复数据筛选出来?

    在使用Excel表格时,当Excel表格数据在数量庞大的情况下,输入重复数据在所难免.但为确保表格最终统计分析结果的准确性,需要快速筛选出重复的数据,进行删除标记等多重处理.人工手动校对数据即浪费时间 ...

  5. python 网页上显示数据_怎么用python将excel数据写入网页中,python 网页上excel表格数据分析...

    用python读取excel,怎样显示要查找的数据? 感觉还是CSV格式的好一些,EXCEL的要装插件,以CSV为例,段代码 sqlserver char 对应c# import linecache ...

  6. python 删除特定行数据_怎么用 Python 做数据分析实例

    01 生成数据表 第一部分是生成数据表,常见的生成方法有两种,第一种是导入外部数据,第二种是直接写入数据. Excel 中的文件菜单中提供了获取外部数据的功能,支持数据库和文本文件和页面的多种数据源导 ...

  7. python爬大学生就业数据_小猪的Python学习之旅 —— 16.再尝Python数据分析:采集拉勾网数据分析Android就业行情...

    一句话概括本文: 爬取拉钩Android职位相关数据,利用numpy,pandas和matplotlib对招人公司 情况和招聘要求进行数据分析. 引言: 在写完上一篇<浅尝Python数据分析: ...

  8. 利用python从网页查找数据_利用Python模拟淘宝的搜索过程并对数据进行可视化分析...

    数据挖掘入门与实战 公众号: datadw 本文讲述如何利用Python模拟淘宝的搜索过程并对搜索结果进行初步的数据可视化分析. 搜索过程的模拟:淘宝的搜索页面有两种形式, 一种形式是, 2019/2 ...

  9. python爬取所有数据_入门用Python进行Web爬取数据:为数据科学项目提取数据的有效方法...

    作者|LAKSHAY ARORA 编译|Flin 来源|analyticsvidhya 总览 Web抓取是一种从网站提取数据的高效方法(取决于网站的规定) 了解如何使用流行的BeautifulSoup ...

最新文章

  1. VS2013\VS2017 使用git 总是需要输入账号密码
  2. 人力资源大数据解决方案
  3. JavaScript 调试建议和技巧
  4. java 企业门户网站 源码 自适应响应式 freemarker 静态引擎 html5 SSM
  5. Java黑皮书课后题第4章:4.20(字符串处理)编写一个程序,提示用户输入一个字符串,显示它的长度和第一个字符
  6. Cloudera-Manager-agent 误删恢复
  7. lvds 共模电感_【成功案例】共模电感CM0805C221R-10解决车载LVDS信号的手持天线抗扰问题...
  8. python钉钉机器人发送消息_python调用钉钉机器人发送消息
  9. 普通人学python有意义吗-为什么那么多自学Python的后来都放弃了,总结起来就这些原因...
  10. 使用 profile 进行python代码性能分析
  11. failed to fetch url linux,ubuntu apt-get下载报failed to fetch错误,请问如何解决
  12. graSSHopper:一个不错的开源SSH工具
  13. Unity查找图片被哪个Prefab引用
  14. SQL中is not null和!=“ “的区别
  15. orcale中like用法详解
  16. 浅谈一下个人基于IRIS后端业务开发框架的理解
  17. iperf3 网络测速工具 —— 筑梦之路
  18. catia草绘标注工具
  19. tt协议号服务器,TTcam协议的账号的写法
  20. Elo等级分制度(Elo Rating System)的原理

热门文章

  1. [NOIP2015] 提高组 洛谷P2661 信息传递
  2. windows下搭建Apache+Mysql+PHP开发环境
  3. 顶级公司在做数据挖掘,却忽略了数据管理平台,这个知识不得不看
  4. C++ Primer中文版(第4版 特别版)
  5. GM也坐不住了的s9t9
  6. 飞鸽传书10048错误的解决
  7. FreeEIM 与飞鸽传书的区别
  8. 36岁程序员感慨:天天加班压力太大,有200万存款能转行了吗?
  9. 最大同性恋交友网站被微软收购,我不服!
  10. 程序员年纪越大,工作被取代性越强