前言

Python的数据清洗功能有多厉害,相信不用我说大家都知道了,寥寥几行代码便可以把一份杂乱无章的表格给处理的干干净净。但是python也是不容易入门的,毕竟编程语言要理解和精通也是要花不少功夫的,所以很多小伙伴纷纷倒在了python的大门外。今天给大家来点干货,教大家如何利用python对EXCEL数据进行筛选,让大家可以对python快速入门,并可以领略到python的数据分析魅力。

数据源

我们要先用到一份EXCEL示例文件,在这里我选用了一份电商订单明细表,数据已脱敏:

EXCEL筛选

如果在EXCEL里进行筛选,我们一般方法是利用EXCEL自身的筛选功能,在弹出的筛选界面里用鼠标进行勾选,例如我们要筛选订单日期为2010年的和订单等级为高级的:

类似以上这样的筛选需求,在EXCEL里就可以实现,当然,除了这个办法之外,我们也可以通过其他的工具去实现,今天在这里教大家利用ETL+python的组合方法去实现,这两个工具在数据清洗上非常厉害。大家不要听到python就打退堂鼓,以下的教程非常浅显易懂,即使是小白也可以快速入门。在开始教学之前,我们要先用到一个厉害的ETL工具:智分析。

加载数据

由于智分析的ETL是在网页端上进行处理的,我们首先要做的就是先把本地的数据源导进智分析平台里,在智分析数据连接的界面里便可以快速把数据源导进来。除了本地的数据文件外,智分析也支持mysql、阿里云等关系型数据库的连接。打开ETL的界面,把关系数据源的组件拉拽到展示区里,根据存放路径找到您的数据源:

鼠标右键点击关系数据源的“查看输出”我们可以对数据源的输出效果进行预览:

条件过滤

当完成了数据连接后,接下来就可以利用智分析ETL里自带的python脚本对数据进行各种处理,我们先把python的组件拉拽到中间的展示区,并与上面的关系数据源进行相连:

点击python的输入框进行查看,可以看到这里的输入框与pycharm等软件的输入框基本一样,只要熟悉python的小伙伴都可以轻松上手,而且系统已经提前输入了部分脚本,这些代码是系统默认自带的,无需自己写,非常贴心。大家可以看到,提前写好的脚本主要是调用numpy、pandas这两个库以及定义了函数:

根据上述提到的需求,我们目的主要是对订单日期以及订单等级这两个字段进行筛选,我们首先先定义两个变量cond与cond1,cond在此处调用了pandas的pd.to_datetime()函数,这是pandas的时间处理函数,后面dt.year要筛选的结果就是年份等于2010年。接下来cond1要筛选的条件就是column4=高级,因为两者是and的关系,写完这两句脚本后,还要用&把这两个条件连接起来。

脚本写完后,点击确定,最后我们看一下python脚本执行后的效果,第二列的订单日期显示为2010年,订单等级显示为高级,只需写3行代码,我们的筛选需求已经实现了:

下篇预告

本文从 Excel 筛选角度介绍简单的应用,下一篇将讲解更复杂的应用,先看看有哪些复杂需求:

·        订单日期筛选2010的订单

·        订单等级筛选高级

·        利润金额前10的订单

下篇将解决以上问题,敬请关注

python做excel数据条件_懂点EXCEL就行!教你利用Python做数据筛选(上)相关推荐

  1. python什么工作好找女朋友_程序员,三分钟教你用 Python 帮你找一个女朋友

    原标题:程序员,三分钟教你用 Python 帮你找一个女朋友 什么是单身税? 单身税的历史可以追溯到2015年韩国的新政, 低生育率逼得韩国产生了这一政策. 现在我国也要实行这一政策, 很多单身狗就接 ...

  2. python青果教务系统抢课_名额不够,技术来凑,利用Python实现教务系统强制性抢课...

    最近一学期一次的抢课大戏又来了,几家欢乐几家愁.O(∩_∩)O哈哈~(l我每次一选就过了hah,我还是有欧的时候滴).看着他们盯着教务系统就着急,何况我们那教务系统,不想说什么.emmm 想周围的朋友 ...

  3. python下载文件并改名_第46p,8行代码,用Python批量重命名文件

    大家好,我是杨数Tos,这是<从零基础到大神>系列课程的第46篇文章,第二阶段的课程:Python基础知识:小案例之用Python批量重命名文件. 学习本课程,建议先看一遍:[计算机基础知 ...

  4. python读取日志错误信息_关于修复 Bug 这件“小事”|利用Python 日志查找错误也可行...

    在 Python 中使用 print() 来输出某个变量从而检查参数错误是修 Bug 前期工作的常用手段.但其实 Python 日志处理用得好会节省时间用于修Bug.记日志会帮助我们理解程序中发生的事 ...

  5. excel 重复方差分析_如何在Excel中运行方差方差分析的两种方法

    excel 重复方差分析 Recently, we looked at how to Perform a One-Way Analysis of Variance in Excel. In today ...

  6. 实战|手把手教你利用Python网络爬虫获取新房数据

    一.项目背景 大家好,我是J哥. 新房数据,对于房地产置业者来说是买房的重要参考依据,对于房地产开发商来说,也是分析竞争对手项目的绝佳途径,对于房地产代理来说,是踩盘前的重要准备. 今天J哥以惠民之家 ...

  7. 手把手教你利用 python 爬虫分析基金、股票

    手把手教你利用 python 爬虫分析基金.股票 文章目录 手把手教你利用 python 爬虫分析基金.股票 第一步:基金数据爬取 第二步:股票增持计算 第三步:好股基金选取 桌面程序 exe 从前大 ...

  8. python微信爬取教程_PYTHON爬虫之旅系列教程之【利用Python开发微信公众平台一】...

    感谢大家的等待,好啦,都准备好瓜子.板凳,老司机要发车啦-- 本系列课程讲述"PYTHON爬虫之旅",具体大纲可参考:[PYTHON爬虫之旅]概要目录. 本节课讲述如何利用Pyth ...

  9. 【赠书】pandas创始人手把手教你利用Python进行数据分析

    周末就要到了,本次给大家赠送5本Python技术书籍,这次赠送的书籍是<利用Python进行数据分析>. 这是一本什么样的书 Python是目前数据科学领域的王者语言,众多科学家.工程师. ...

最新文章

  1. 1013 - 把握趋势
  2. erp框架 saas_【观察】一周之后,浪潮云ERP将直面数字化转型2.0四大攻坚战
  3. 在NumericStepper控件中使用嵌入字体显示数字.
  4. java nio的演进_Java接口的防御性API演进
  5. oracle 052 题库更新,OCP题库升级,新版052考试题及答案整理-18
  6. Python文本转化语音模块大比拼,看看青铜与王者的差别!
  7. 为什么c语言乘除法优先级低,C语言训练题.docx
  8. 2005数据库结构显示收藏
  9. 接口怎么获取数组底下的数组_3分钟短文 | PHP数组获取最后一个元素,10个方式中哪个有错?...
  10. 丢机者要哭:苹果移除了 iCloud 激活锁状态查询页面
  11. 计算机二进制拨码,二进制拨码
  12. 武汉大学计算机学院选考要求,武汉大学高考必选科目-考武汉大学需要选哪三科...
  13. PES、PS、TS详解
  14. BZOJ 3772 精神污染 主席树+欧拉序
  15. python产生一个1到10的列表_python-列表生成式(一)
  16. 删除子文件夹[字典树 + go变量 + strings.builder的copyCheck()]
  17. 2013华为工作之电信客服上线
  18. 小程序onreachbottom不执行
  19. java接入顺丰快递api(有可运行demo)(包括下单、路由查询、路由推送、查询订单状态、取消订单)
  20. JAVA版不祥之兆等级怎么看,袭击队长 - Minecraft Wiki,最详细的官方我的世界百科...

热门文章

  1. Unity Profiler
  2. 计算机网络WAN接口,无线路由器WAN口连接类型如何选择【详细介绍】
  3. js和jsp的区别和联系
  4. LeetCode 对角线遍历(找规律)
  5. windows7启动出现0xc000014c错误代码解决办法
  6. 曲面积分的投影法_大学数学:第一、二型曲面积分:投影、高斯公式补面挖点怎么用...
  7. 【LeetCode】第643题——子数组最大平均数I(难度:简单)
  8. 谈谈如何判断一个Pop序列是否是一个Push序列的Pop顺序
  9. Qt调试错误:The inferior stopped because it received a signal from the Operating System.SIGSEGV
  10. 计算机强制退出程序键,电脑强制关闭程序按哪三个键