01写在前面

大家好,我是阳哥,欢迎来到「Python数据之道」。

本次是《图解Pandas》系列图文内容的 第 08 篇,主要介绍 Pandas 中常见的数据筛选

本文是付费阅读文章,付费阅读内容包括《图解Pandas》图文干货内容、可以在电脑端观看的视频以及配套的源代码等。

此外,为避免各种不必要的麻烦,微信没有退款机制,付费前请谨慎。

Pandas 是 Python数据分析中用的最多的工具,为了大家能够更好地学习 Pandas,阳哥开始制作一系列 《图解Pandas》 的内容。

《图解Pandas》 最主要的目标,是以视频图解、动态图片等方式呈现,拆解 Pandas 在数据处理过程中的主要知识点,以便大家能进一步了解 Pandas 的使用,形象地介绍 Pandas,进而使大家喜欢上 Pandas 这个工具。

《图解Pandas》图文专题,最新的内容可以点击下面的图片进行查看。

在本文编写时,《图解Pandas》系列已发布的图文如下:

图文链接 对应的视频编号
《图解Pandas》内容框架介绍 -
图文01-数据结构介绍 001
图文02-创建数据对象 002
图文03-读取和存储Excel文件 003、004
图文04-常见的数据访问 005
图文05-常见的数据运算 006、007、008
图文06-常见的数学计算 009、010
图文07-常见的数据统计 011、012、013、014、015

本次主要介绍 Pandas 中常见的数据筛选 ,内容框架如下:

主要内容

该主题包括 13 期视频,在微信视频号「Python数据之道」中发布的对应视频编号为 016028,大家可以前往观看:

注:本文发布时,在视频号中可以观看视频 016024,后续将发布 025028

在本文后面内容中可以同时观看视频 016028

扫描下面的二维码,关注视频号,可以观看《图解Pandas》已发布的所有视频以及及时推送最新的视频:

02常见的数据筛选

Python环境

开始之前,按照惯例先介绍下本次内容涉及的Python环境,如下:

  • Python 3.8

  • Pandas 1.4.1

  • numpy 1.22.3

我是在 jupyter notebook 中运行代码的,首先引入相关 Python 库:

import pandas as pd
import numpy as npprint(f'pandas version:{pd.__version__}')
print(f'numpy version:{np.__version__}')# pandas version:1.4.1
# numpy version:1.22.3

创建数据

咱们先来创建一个dataframe,也就是“数据框”。

关于创建数据对象的详细介绍,大家可以观看 「图解Pandas」系列的第2期视频。

创建 df 如下:

d = {"name": [ "Lemon", "Jack", "Peter","Emma","James"],"city": ["长沙", "上海", "深圳","北京","北京"],"a": [80, 90, 60,73,89],"b": [80, 75, 80,85,83],"c": [70, 75, 80,73,62],
}
df = pd.DataFrame(d,index=list('efghk'))
df

来看看数据框“df”的数据结构,为5行5列,数值类型包括字符串和整型。后续,会根据需要在该数据框的基础上,创建其他的一些数据框。

数据筛选,是运用Pandas进行数据处理的一个重要方面,实现的方法也是多种多样, 这里汇总了Pandas中比较常见的数据筛选方法。

主要内容

在内容介绍过程中,主要是针对数据框介绍各种方法的应用。同时,也需要知道,其中有不少方法,对于Series也是适用的。

获取头尾数据

在Pandas中,head()函数 和 tail()函数分别用来获取数据框的头尾数据。

先来看 head() 函数,是用来获取头部数据的,对于数据框,获取头部的数据行。这里获取了数据框前 2 行数据,如下:

tail() 函数,是用来获取尾部数据的,对于数据框,获取尾部的数据行。这里获取了数据框最后2行数据,如下:

head 函数 和 tail 函数,对于 Series 也是适用的。

head函数获取series最前面的两组数据,如下:

tail函数获取series最后面的两组数据,如下:

列数据的获取

对于数据框中列数据的获取,这里先分享几种最基础的方法。

df['name'] 的形式, 可以直接选取某列,其中 “name” 为列名称。如下:

df.col 方法 (col为列名称),也可以实现列的选取,需要注意的是,用这种方法,列名称中不能有空格。如下:

也可以用列表的方式,实现同时选取多列,这里选取了 "name" 和 "a" 两列,如下:

对于数据框中列数据的获取,还可以使用 get函数,该函数有两个参数。

DataFrame.get(key, default=None)

其中 key 是 列名称,或者由列名称组成的列表。

这里设置 key 为 列名称,获取某列,如下:

设置key为列表,则可以获取某几列,这里获取 "name" 和 "a" 两列,如下:

需要注意下,如果列表中有数据框中不存在的列名称,则返回 default 参数的值,这里设置为 "error",由于 数据框df中没有列名称为"ab"的列,因此返回 "error" 。

如下:

Pandas中常见的20多种数据筛选方法,116张图详解 | 图解Pandas-图文第8篇相关推荐

  1. Java中常见RuntimeException与其他异常表及Exception逻辑关系详解

    Java中常见RuntimeException与其他异常表及Exception逻辑关系详解 前言 常见`RuntimeException` 其他错误类型 `Error`类 `Exception`类 E ...

  2. 60 张图详解 98 个常见网络概念

    Hi ,大家好,我是 Fox .计算机网络的原理其实很简单,但是套上专业名词后,那些看不见.摸不着的概念,会让人云里雾里.其实理解了网络名词,再去学习网络,会感觉像打开了任督二脉,发现网络不过如此.因 ...

  3. 安卓手机备份_安卓手机数据备份与恢复方法汇总和操作详解

    世界那么大,谢谢你来看我!!关注我你就是个网络.电脑.手机小达人 每次使用电脑时,我们都会自觉的将重要的文件保存好并且备份起来防止丢失.那同样的,我们在使用手机时,也要养成手机备份的好习惯. 今天就来 ...

  4. 安卓手机数据备份与恢复方法汇总和操作详解

    每次使用电脑时,我们都会自觉的将重要的文件保存好并且备份起来防止丢失.那同样的,我们在使用手机时,也要养成手机备份的好习惯. 今天小编就来分享几个备份手机数据的方法,希望能帮到大家. 一.手机系统备份 ...

  5. Pandas中的轴向堆叠数据—concat()方法

  6. 数据可视化之箱线图详解

    一.箱线图 箱线图(Box-plot)又称盒须图.盒式图或箱形图,是一种用作显示一组数据分散情况资料的统计图,在数据分析中经常被使用到,可以被用于异常值的检测. 通过箱线图可以很容易找到数据中的异常值 ...

  7. 20张图 详解 负载均衡

    前言 今天我们来深度揭秘一下负载均衡器 LVS 的秘密,相信大家看了你管这破玩意儿叫负载均衡?这篇文章后,还是有不少疑问,比如 LVS 看起来只有类似路由器的转发功能,为啥说它是四层(传输层)负载均衡 ...

  8. python中turtle画雪花_turtle画雪花-方法及效果的详解

    效果图: 代码: import turtle as t import random as r # 定义画雪 def drawsnow(): t.ht() # 隐藏笔头,ht=hideturtle t. ...

  9. 图解大数据 | 分布式平台Hadoop与Map-Reduce详解

    作者:韩信子@ShowMeAI 教程地址:https://www.showmeai.tech/tutorials/84 本文地址:https://www.showmeai.tech/article-d ...

最新文章

  1. addroutes刷新_vue 解决addRoutes动态添加路由后刷新失效问题
  2. Struts2利用iText导出word文档(包含表格)
  3. 千万别让这些举动断送了你的职业前程-好文共分享
  4. JavaScript / HTML5中的音效
  5. 工具类用得好,下班下的早
  6. C++编写DLL的方法
  7. PCA、SVD、ZCA白化理论与实现
  8. 《HTML5触摸界面设计与开发》——1.4 神秘谷,是什么让触摸界面反应灵敏?...
  9. 挖掘城市ip_不断挖掘IP价值,紧抓乐园经济新机遇!
  10. Node.js下载安装及各种npm、cnpm、nvm、nrm配置(保姆式教程—提供全套安装包)—cnpm的安装与配置(3)
  11. 半数以上国产手游曾使用他开源的引擎:Cocos和王哲的故事 | 二叉树视频
  12. HTML 5中的tips两则
  13. 能够编辑excel的python 软件有哪些_生产管理系统有哪些
  14. 光纤接头(尾纤)ST,SC,LC,FC 模块
  15. 计算机视觉之基本概论
  16. stm32f103zet6定时器和pwm简单驱动步进电机
  17. python实现排列组合公式C(m,n)求值
  18. 阿里云云虚拟主机开启安装SSL证书,开启HTTPS访问
  19. 程序员如何实现财务自由?
  20. 联通光猫HG2543C1改桥接备忘

热门文章

  1. 数字图像处理(16): 图像颜色空间转换 和 OpenCV图像灰度化处理
  2. 【JPress】Menu
  3. 服务器机房消防系统,服务器机房消防系统和维护
  4. 闲谈mac地址学习以及IVL/SVL
  5. 无涯教程: Laravel 8 - 队列介绍
  6. TZC Python编程入门教程 ————题解
  7. 过完备深度子空间聚类网络:《Overcomplete Deep Subspace Clustering Networks》
  8. 瓜娃系列 (6) - ComparisonChain和primitives包
  9. 金多多简述调整浪的特征十分明显
  10. jQuery实现消息提示框