前言

回顾一下上次的案例模型,我们知道了只要写3行代码,就可以利用python对EXCEL数据做简单的筛选,说明了python是一门非常简单和实用的数据分析工具。前面学过的这几句简单的语言,不知道你们学会了没?今天我们依旧是利用ETL+Python的搭配组合,对EXCEL数据进行深层次的加工,这一次我们要做的是高级筛选,请跟着我一起学习吧。

数据源

我们还是用上次的那份电商订单明细表,数据已脱敏:

EXCEL筛选

我们回顾一下上一篇文章里的数据需求,第一个是根据订单日期筛选2010年的订单,第二个是根据订单等级去筛选高级的订单,这一次我们把筛选条件进行升级,增加一个条件:在原先两个筛选条件的基础上,筛选出利润金额前10的订单。如果在EXCEL里操作的话,可以利用公式或者自身的筛选功能去实现,但是在python又是怎样实现的呢?

我们可以在pycharm等软件上写python脚本去实现,但是我推荐大家用智分析的ETL功能去实现,智分析的ETL界面里也提供了python脚本的编写页面,并且很多简单的需求通过ETL就能实现,无需撰写复杂的代码,非常适合编程小白。

加载数据

打开智分析里ETL界面,我们先连接好数据源,我已经提前把EXCEL文件导入到了智分析的系统里,然后把关系数据源拉拽到展示区里,并在右边找到数据源存放的路径:

加载完成后,我们可以对数据源进行预览:

条件过滤

当完成了数据连接后,接下来就可以利用智分析ETL里自带的python脚本对数据进行各种处理,我们先把python的组件拉拽到中间的展示区,并与上面的关系数据源进行相连:

以下脚本是智分析自带的脚本,已经提前安装好了pandas和numpy的库,后面的函数也写好了一部分代码,只要根据以下脚本进行扩展,便可以在ETL上利用python进行数据清洗:

在输入python脚本之前,我们再明确一下要实现的需求,其中前面两个条件是和上次一样的,我们无需进行改动,直接复制脚本过来即可,如果不懂的可以查看我前一篇文章。第三个条件需要做的是筛选利润额前10的订单,这里我们引用pandas中的sort_values函数进行排序,原理类似于SQL中的order by,可以将数据集依照某个字段中的数据进行排序,后面接ascending=False,即对数据进行降序排列,head(10)代表的是取前10的值:

我们看一下python脚本执行后的效果,年份这一列把2010年给筛选出来了,订单这一列筛选的是高级的订单,订单利润这一列的数据按照降序把前10的数据给筛选出来了:

数据输出

完成python的筛选程序后,我们把执行筛选后的表格进行保存,可以选择保存在数据库中,也可以保存在数据集里,这里我依旧选择数据集的保存方式,因为方便在EXCEL里进行调用:

回到EXCEL里,点击EXCEL插件里的“视图”,在右边会出现智分析的数据集面板界面,点击下拉菜单,便可以找到保存在云端的数据集,也可以直接输入文件名进行搜索:

点击EXCEL工具栏上的“刷新”,数据集里的字段便会显示在EXCEL里,我们就可以利用这些数据在EXCEL里进行数据分析了:

下篇预告

本文介绍了python的多条件筛选功能,下一篇将讲解如何对字段进行去重,敬请关注。

python数据处理可以做什么菜_厌倦了EXCEL想玩点新花样?教你利用Python做数据筛选(下)...相关推荐

  1. 手把手教你利用 python 爬虫分析基金、股票

    手把手教你利用 python 爬虫分析基金.股票 文章目录 手把手教你利用 python 爬虫分析基金.股票 第一步:基金数据爬取 第二步:股票增持计算 第三步:好股基金选取 桌面程序 exe 从前大 ...

  2. 实战|手把手教你利用Python网络爬虫获取新房数据

    一.项目背景 大家好,我是J哥. 新房数据,对于房地产置业者来说是买房的重要参考依据,对于房地产开发商来说,也是分析竞争对手项目的绝佳途径,对于房地产代理来说,是踩盘前的重要准备. 今天J哥以惠民之家 ...

  3. python学好了可以做什么菜_你是怎么学好Python的?

    一. 首先,Excel在入门基础知识.上手解决实际工作问题.深化技能实战方面比Python更容易: 其次,在对Excel已经很熟悉的情况下,我们知道Excel的每种功能的背后都是一行行代码,这一行行代 ...

  4. python运行excel高级筛选怎么用_懂点EXCEL就行!教你利用Python做数据筛选(上)...

    前言 Python的数据清洗功能有多厉害,相信不用我说大家都知道了,寥寥几行代码便可以把一份杂乱无章的表格给处理的干干净净.但是python也是不容易入门的,毕竟编程语言要理解和精通也是要花不少功夫的 ...

  5. python excel筛选统计_懂点EXCEL就行!教你利用Python做数据筛选(上)

    前言 Python的数据清洗功能有多厉害,相信不用我说大家都知道了,寥寥几行代码便可以把一份杂乱无章的表格给处理的干干净净.但是python也是不容易入门的,毕竟编程语言要理解和精通也是要花不少功夫的 ...

  6. python做excel数据条件_懂点EXCEL就行!教你利用Python做数据筛选(上)

    前言 Python的数据清洗功能有多厉害,相信不用我说大家都知道了,寥寥几行代码便可以把一份杂乱无章的表格给处理的干干净净.但是python也是不容易入门的,毕竟编程语言要理解和精通也是要花不少功夫的 ...

  7. python 青少年人工智能_青少年人工智能教育的典范 优必学教孩子用Python编写一部人工智能的字典...

    Python是一种计算机程序设计语言,是一种动态的.面向对象的脚本语言,最初被设计用于编写自动化脚本.从20世纪90年代初诞生至今,Python正在迅速成为全球大中小学编程入门课程的首选教学语言,这种 ...

  8. python写闲鱼脚本_自动化篇 | 你想要的闲鱼日常操作,Python 给你实现了

    1 目 标 场 景 前篇文章讲了如何在 iOS 端使用 Airtest 实现自动化的操作,本篇将继续带大家做 iOS 端的自动化项目. 如果你经常用闲鱼,应该每天都要进行下面操作,App 签到.鱼塘签 ...

  9. 老板说你做的excel表格不够美化简洁?教你用Python一招搞定

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以点击下方链接自行获取 Python免费学习资料 ...

最新文章

  1. nlp 优缺点 混淆度_NLP中文分词的评估指标
  2. vs2013突然没有代码提示功能了。
  3. rsync 常见错误与解决方法整理
  4. 两个不同的文件相互引用全局变量
  5. ACM-ICPC 2018 徐州赛区网络预赛 D. Easy Math
  6. 创建虚拟磁盘的小工具软件plainmaker.exe
  7. linux c之使用#define定义多行函数总结
  8. 立体视觉(Stereo Vision)-本征矩阵(essential matrix)和基本矩阵(fundamental matrix)
  9. 12、(12.4.2)保护模式下数据段和栈段保护
  10. 蓝桥杯 波动数列 01背包
  11. spring+jdbc+template+transaction实现
  12. linux 实现离线迅雷,Linux下使用wget/aria2进行离线迅雷批量下载
  13. 投 资 网 站 建 设 方 案
  14. 背篼酥课堂-GPS定位(一) nodemcu 解析gps
  15. 对鸿蒙操作系统和AI Camera Hi3516dDV300 开发过程的记录和理解
  16. c语言中fgetc函数的介绍
  17. AngularJs错误
  18. 无极符和鸿蒙符哪个好,无极仙途内丹属性哪个好? 单属性与双属性内丹对比详解...
  19. JS键盘事件—onkeydown,onkeyup
  20. 海驾学车过程全揭秘——第三篇:重要的法培

热门文章

  1. 给实践者的算法学习指南
  2. 轻量级的移动开发JavaScript框架-zepto.js
  3. Linux中的压缩命令
  4. 服务器运算性能,服务器性能计算公式(20191116215459).pdf
  5. Window CE 驱动开发流程(Windows CE.5.0系统、pxa270平台)
  6. 湖南师大工学院计算机,张连明-湖南师范大学信息科学与工程学院
  7. mysql8.0.15免安装版配置_Win10配置MySQL8.0.15免安装版教程
  8. python进阶与数据操控_python进阶(mysql:表操作、数据操作、数据类型)(示例代码)...
  9. python tkinter frame滚动条_如何在Tkinter中创建带有滚动条的LabelFrame?
  10. Anaconda+django写出第一个web app(五)