前言

Python的数据清洗功能有多厉害,相信不用我说大家都知道了,寥寥几行代码便可以把一份杂乱无章的表格给处理的干干净净。但是python也是不容易入门的,毕竟编程语言要理解和精通也是要花不少功夫的,所以很多小伙伴纷纷倒在了python的大门外。今天给大家来点干货,教大家如何利用python对EXCEL数据进行筛选,让大家可以对python快速入门,并可以领略到python的数据分析魅力。

数据源

我们要先用到一份EXCEL示例文件,在这里我选用了一份电商订单明细表,数据已脱敏:

EXCEL筛选

如果在EXCEL里进行筛选,我们一般方法是利用EXCEL自身的筛选功能,在弹出的筛选界面里用鼠标进行勾选,例如我们要筛选订单日期为2010年的和订单等级为高级的:

类似以上这样的筛选需求,在EXCEL里就可以实现,当然,除了这个办法之外,我们也可以通过其他的工具去实现,今天在这里教大家利用ETL+python的组合方法去实现,这两个工具在数据清洗上非常厉害。大家不要听到python就打退堂鼓,以下的教程非常浅显易懂,即使是小白也可以快速入门。在开始教学之前,我们要先用到一个厉害的ETL工具:智分析。

加载数据

由于智分析的ETL是在网页端上进行处理的,我们首先要做的就是先把本地的数据源导进智分析平台里,在智分析数据连接的界面里便可以快速把数据源导进来。除了本地的数据文件外,智分析也支持mysql、阿里云等关系型数据库的连接。打开ETL的界面,把关系数据源的组件拉拽到展示区里,根据存放路径找到您的数据源:

鼠标右键点击关系数据源的“查看输出”我们可以对数据源的输出效果进行预览:

条件过滤

当完成了数据连接后,接下来就可以利用智分析ETL里自带的python脚本对数据进行各种处理,我们先把python的组件拉拽到中间的展示区,并与上面的关系数据源进行相连:

点击python的输入框进行查看,可以看到这里的输入框与pycharm等软件的输入框基本一样,只要熟悉python的小伙伴都可以轻松上手,而且系统已经提前输入了部分脚本,这些代码是系统默认自带的,无需自己写,非常贴心。大家可以看到,提前写好的脚本主要是调用numpy、pandas这两个库以及定义了函数:

根据上述提到的需求,我们目的主要是对订单日期以及订单等级这两个字段进行筛选,我们首先先定义两个变量cond与cond1,cond在此处调用了pandas的pd.to_datetime()函数,这是pandas的时间处理函数,后面dt.year要筛选的结果就是年份等于2010年。接下来cond1要筛选的条件就是column4=高级,因为两者是and的关系,写完这两句脚本后,还要用&把这两个条件连接起来。

脚本写完后,点击确定,最后我们看一下python脚本执行后的效果,第二列的订单日期显示为2010年,订单等级显示为高级,只需写3行代码,我们的筛选需求已经实现了:

下篇预告

本文从 Excel 筛选角度介绍简单的应用,下一篇将讲解更复杂的应用,先看看有哪些复杂需求:

· 订单日期筛选2010的订单

· 订单等级筛选高级

· 利润金额前10的订单

下篇将解决以上问题,敬请关注

python excel筛选统计_懂点EXCEL就行!教你利用Python做数据筛选(上)相关推荐

  1. 怎么用python编贪吃蛇_少儿编程分享:手把手教你用PYTHON编写贪吃蛇(二)

    原标题:少儿编程分享:手把手教你用PYTHON编写贪吃蛇(二) 检测和判断 无论我们制作的简单或者复杂的游戏 这都是最关键的两个部分 事件处理循环 61. while True: # 游戏主循环 62 ...

  2. python俄罗斯方块编程思路_少儿编程分享:手把手教你用Python编写俄罗斯方块(十)...

    www.codingmarch.com 游戏分享:手把手教你用 Python 编写 俄罗斯方块(十) 2017.12.28 这是俄罗斯方块的最后一章了 经历了这么多游戏 编写了这么多代码 你的心中是否 ...

  3. python图形设计编程_少儿编程分享:手把手教你用Python制作艺术图片

    原标题:少儿编程分享:手把手教你用Python制作艺术图片 在前面的几篇文章中,我们分享了一些用PyGame制作小游戏的教程.我们今天的分享使用的仍然是PyGame,只不过这次不是写游戏啦-我们要用P ...

  4. python兔子和獾_少儿编程分享:手把手教你用PYTHON编写兔獾大作战(三)

    让小兔子转向 现在,你的小兔子可以根据你的按键移动了! 不过现在小兔子一直面向右边.如果能用鼠标让小兔子面对不同的方向,不就更酷了吗!我们只需要用一些简单的三角函数知识就能解决这个问题. 让我们一起看 ...

  5. python itchat 无法登录_项目分享|5步教你用Python制作朋友圈个性签名

    前言 今天带大家玩点好玩的东西,用Python制作自己朋友圈个性签名的词云,有趣吧~好了,下面开始干活.我知道你们还是想先看看效果的. 环境准备 语言环境:Python 3.6 工具:Pycharm ...

  6. python训练营 朋友圈_项目分享|5步教你用Python制作朋友圈个性签名

    前言 今天带大家玩点好玩的东西,用Python制作自己朋友圈个性签名的词云,有趣吧~好了,下面开始干活.我知道你们还是想先看看效果的. 环境准备 语言环境:Python 3.6 工具:Pycharm ...

  7. python抢购火车票源代码_五一要来了,教你用Python动刷新抢12306火车票,附源码...

    用python另一个抢票神器,你get到了吗? 2020年时间飞逝,转眼间马上要到五一了,还在为抢不到火车票发愁吗?作为程序员的我们撸一个抢票软件可好? ... 难以想象的数据, 预示着今年春运回程和 ...

  8. python制作流动图_可视化也能秀,教你用Python制作GIF动图

    欢迎大家关注 集智专栏 之前我们分享过用 Python 进行可视化的 9 种常见方式,大家还记得吗: 景略集智:超实用!用Python进行数据可视化的9种常见方法!​zhuanlan.zhihu.co ...

  9. python抢票代码_五一要来了,教你用Python动刷新抢12306火车票,附源码

    用python另一个抢票神器,你get到了吗? 2020年时间飞逝,转眼间马上要到五一了,还在为抢不到火车票发愁吗?作为程序员的我们撸一个抢票软件可好? ... 难以想象的数据, 预示着今年春运回程和 ...

最新文章

  1. Nachos3.4系列-1 安装与环境配置 【转】
  2. Leetcode 204. 计数质数 解题思路及C++实现
  3. MongoDB(7.mongodb中创建索引)
  4. 实现自己的.NET Core配置Provider之Yaml
  5. 《ArcGIS Runtime SDK for Android开发笔记》——离在线一体化技术:离线矢量数据下载...
  6. 五句话搞定JavaScript作用域
  7. Security6:查看授予的权限
  8. IT运维的五大基础知识
  9. Centos7搭建maven私服nexus3,互联网大厂高频重点面试题
  10. TCPClient代码
  11. QT添加图标/任务栏样式记录
  12. Unity3d+倾斜摄影技术应用
  13. 年轻人,你为什么要来阿里搞技术?
  14. C语言内存空间分布详解
  15. 谈谈使用破解百度云app的安全风险
  16. 《神经网络与深度学习》习题答案
  17. 台式机开机黑屏一直闪小横杠,键盘灯鼠标均正常,主板亮
  18. ExcelVBA之MsgBox函数的运行值结果
  19. 手动配置协议和服务器POP,企业邮箱如何设置POP/SMTP等服务-上海腾曦网络[foxmail]...
  20. 计算机网络课后答案(朱晓姝版)

热门文章

  1. Mumble安装部署教程
  2. 处理任意类型链表模板
  3. 传递函数的幅频特性计算方法
  4. 【信息系统项目管理师】第十二章 项目采购管理思维导图
  5. arm64_linux head.S的执行流程(3.18)- 12.msm8996 地址空间布局
  6. HTTP协议-python接口自动化话测试(无涯)
  7. 2019icpc南京网络赛 Holy Grail(SPFA)
  8. 不同vlan实现互通
  9. tar命令中参数 cvf,xvf,cvzf,zxvf的区别
  10. 计算机内部组成原理及内部子系统概述