pandas的DataFrame对象,本质上是二维矩阵,跟常规二维矩阵的差别在于前者额外指定了每一行和每一列的名称。这样内部数据抽取既可以用“行列名称(对应.loc[]方法)”,也可以用“矩阵下标(对应.iloc[]方法)”两种方式进行。

下面具体说明:

(以下程序均在Jupyter notebook中进行,部分语句的print()函数省略)

首先生成一个DataFrame对象:

import pandas as pd

score = [[34,67,87],[68,98,58],[75,73,86],[94,59,81]]

name = ['小明','小红','小李']

course = ['语文','数学','英语','政治']

mydata1 = pd.DataFrame(data=score,columns=name,index=course)#指定行名(index)和列名(columns)

print(mydata1)

mydata2 = pd.DataFrame(score)#不指定行列名,默认使用0,1,2……

print(mydata2)

#指定行列名

小明 小红 小李

语文 34 67 87

数学 68 98 58

英语 75 73 86

政治 94 59 81

#采用默认行列名

0 1 2 (默认列名)

0 34 67 87

1 68 98 58

2 75 73 86

3 94 59 81

DataFrame对象生成时除了必须指定data参数外,用户还可以指定两个参数columns(列名)和index(行名,注意这里的index不仅可以是数字,也可以是用户指定的任何数据类型,如字母),如果不指定,则行列名默认都采用0、1、2……。

下图说明了前面的情况:

DataFrame对象的.loc[]和.iloc[]方法都可用于抽取数据,区别是:

.loc[]:是location,以columns(列名)和index(行名)作为参数。

.iloc[]:是index location,以二维矩阵的位置指标(即0,1,2……)作为参数。

.loc[]语法

.loc[行标签名/[行标签名list],列标签名/[列标签名list]],即有两个输入参数,第一个指定行名,第二个指定列名。当只有一个参数时,默认是行名(即抽取整行),所有列都选中。

.iloc[]语法

.loc[行位置/[行位置list],列位置/[列位置list]],也有两个输入参数,第一个指定行位置,第二个指定列位置。当只有一个参数时,默认是行位置(即抽取整行),所有列都选中。

例1.抽取1行数据

#以下用.loc[]抽取1行名为‘语文'的数据(包括所有列)

mydata1.loc['语文']

mydata1.loc['语文',]

mydata1.loc['语文',:]

mydata1.loc[['语文'],]

mydata1.loc[['语文'],:]

#以下用.iloc[]抽取1行名为‘语文'的数据(包括所有列)

mydata1.iloc[0]

mydata1.iloc[0,]

mydata1.iloc[0,:]

mydata1.iloc[[0],]

mydata1.iloc[[0],:]

#输出方式1(第1个参数无[],这是一个Series对象):

小明 34

小红 67

小李 87

Name: 语文, dtype: int64

#输出方式2(第1个参数有[],这是一个DataFrame对象):

小明 小红 小李

语文 34 67 87

Name: 语文, dtype: int64

上述.loc[]和.iloc[]都只接收了1个参数“语文”或者“0”,因此默认都表示行信息,而列则全部被选中,即抽取'语文'这整一行数据。','表示将两个参数隔开(如果有两个参数的话),':'这里表示选择中所有列。当只有一个输入参数时,python默认','和':'既可写上也可省略。注意:参数['语文']或[0]中只有一个对象时(即只有一行),[]也可以省略,如果有多个对象(即多行)则必须加上[]。此外还需注意,加上[]表示抽取的结果无论是一个数据,一行数据,还是一列数据,他都是DataFrame对象;不加[]时,如果选中的是一行或者一列数据,则是Series对象,如果是一个单独的数据,则是该数据本身的类型。

例2.指定行名抽取任意多行数据

#指定多行行名抽取

mydata1.loc[['英语','语文','政治'],:]

小明 小红 小李

英语 75 73 86

语文 34 67 87

政治 94 59 81

mydata1.iloc[[1,0],:]

小明 小红 小李

数学 68 98 58

语文 34 67 87

例2和例1唯一的差别是,第一个参数指定了多行一起输出,此时必须用[]将各行名或者下标括起来,否则出错。后面的','和':'同例1,可省略。注意:原始数据的行顺序是:语文、数学、英语、政治,这里的提取顺序是['英语','语文','政治'],而输出也是'英语','语文','政治',可见输出顺序和参数指定顺序是一致的,而非按原始顺序输出。

例3.抽取连续任意多行数据

mydata1.loc['语文':'英语',:] #连续抽取从语文到英语的所有行

小明 小红 小李

语文 34 67 87

数学 68 98 58

英语 75 73 86

mydata1.loc[:'英语',:] #连续抽取从第1行到英语的所有行

小明 小红 小李

语文 34 67 87

数学 68 98 58

英语 75 73 86

mydata1.iloc[0:3,:] #连续抽取1~3行

小明 小红 小李

语文 34 67 87

数学 68 98 58

英语 75 73 86

mydata1.iloc[1:,:] #连续抽取第2行最后一行

小明 小红 小李

数学 68 98 58

英语 75 73 86

政治 94 59 81

例3依然是接受1个参数,列参数没有,后面的','和':'同例1,可省略。连续参数用‘start:end'的方式指定行范围。注意:这里不能用[]将其括起来,否则出错。此外用行列名连续取值时,比如['语文':'政治']会把'政治'所在行也取出来,而利用矩阵下标时,0:3只取0,1,2对应的三行,最后一行不会取出;但是如果行列标签名本身就是整数0,1,2……,而不是文字或者其他类型,那么在使用连续行列标签名取数据时,最后一行或者列是不会被取出的。

例4.抽取“列”的各种情况

mydata1.loc[:,['小红']] #所有行,小红列,只有一列时,内部[]也可以省略

小红

语文 67

数学 98

英语 73

政治 59

mydata1.loc[:,['小明','小红']] #所有行,小明和小红两列

小明 小红

语文 34 67

数学 68 98

英语 75 73

政治 94 59

mydata1.iloc[:,[1,2]] #所有行,第2和第3列

小红 小李

语文 67 87

数学 98 58

英语 73 86

政治 59 81

mydata1.loc[:,'小明':] #连续抽取从小明列开始到最后一列

小明 小红 小李

语文 34 67 87

数学 68 98 58

英语 75 73 86

政治 94 59 81

mydata1.iloc[:,:3] #连续抽取从1列开始到第3列

小明 小红 小李

语文 34 67 87

数学 68 98 58

英语 75 73 86

政治 94 59 81

抽取整列的方式跟抽取整行在参数设置上完全一样。.loc[]和.iloc[]两个方法默认列为第二个参数,因此抽取整列时,都必须带上':,'作为区分前面行参数的‘分隔符',否则出错。

例5.同时抽取指定行和列对应数据

mydata1.loc['语文','小明'] #输入了两个参数,输出语文行小明列,即一个数据

34

#没带[]时,单个数字是这种类型

mydata1.loc[['语文'],['小明']] #输出语文行小明列,即一个数据

小明

语文 34

#带[]时,输出依然是DataFrame对象

mydata1.iloc[1,2] #第2行第3列数据,单个数据

58

#注意没带[]时的输出类型

mydata1.iloc[[1],[2]]

小李

数学 58

#注意带[]时的输出类型

mydata1.loc[['语文','数学'],['小明']] #输出语文数学行,小明列的数据

小明

语文 34

数学 68

mydata1.iloc[1:,[0,2]] #输出从第2行到最后一行,第1和第3行对应数据

小明 小李

数学 68 58

英语 75 86

政治 94 81

同时抽取分部行和列的情况,就是把上述单独抽取行和列的方式合并起来用。抽取整个DataFrame对象则是.loc[:,:]或.iloc[:,:],虽然这么做没啥意义。

总结:

(1)DataFrame对象的.loc[,]和.iloc[,]方法用于抽取数据,.loc[,]用行列的标签名作为参数,.iloc[,]用二维矩阵元素的网格下标作为参数。

(2)两个方法都接受两个参数,第一个是“行标签”或者“矩阵行号”,第二个是“列标签”或者“矩阵列号”。

(3)两种方法当只指定一个输入参数时,都默是跟“行”相关,而“列”则全部被选中。如何行和列都需要指定时,中间用“逗号,”隔开,这非常重要,否则出错。

(4)当需要选中所有行的某几列时,行参数可以省略,列参数需要指定,此时列参数前面必须带上“,:”,形如.loc[:,列参数],.iloc[:,列参数]。

(5).loc[,]和.iloc[,]设置了一个还是两个输入参数,关键看有没有“,”将两个参数分开,且要区分逗号是一个参数的内部逗号,还有用于分隔行列参数的逗号。

(6)对于两个参数的概念区分,.loc['语文','数学']这表示输入了两个参数,行参数是‘语文',列参数是‘数学',对于上面的表格而言这是错的,因为没有叫‘数学'的列,应写为[['语文','数学']],即‘数学'也是行参数的一部分,['语文','数学']整体作为一个行参数,这里的逗号不是用以分隔行和列,仅仅是行list里面的逗号。[['语文','数学']]=[['语文','数学'],]=[['语文','数学'],:],都表示只有一个行参数,列全部选中。

到此这篇关于详解pandas中利用DataFrame对象的.loc[]、.iloc[]方法抽取数据的文章就介绍到这了,更多相关pandas .loc[]、.iloc[]抽取数据内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

python中的iloc函数_详解pandas中利用DataFrame对象的.loc[]、.iloc[]方法抽取数据相关推荐

  1. java中static修饰函数_详解java中static关键词的作用

    在java中,static是一个修饰符,用于修饰类的成员方法.类的成员变量,另外可以编写static代码块来优化程序性能:被static关键字修饰的方法或者变量不需要依赖于对象来进行访问,只要类被加载 ...

  2. java中的values函数_详解java 中valueOf方法实例

    case1:Object 对象转String 需要强调的是String.valueOf()方法,当参数为类型是object,且值时null的时候他的处理方式public static String v ...

  3. python中squeeze函数_详解pytorch中squeeze()和unsqueeze()函数介绍

    squeeze的用法主要就是对数据的维度进行压缩或者解压. 先看torch.squeeze() 这个函数主要对数据的维度进行压缩,去掉维数为1的的维度,比如是一行或者一列这种,一个一行三列(1,3)的 ...

  4. python socket自动重连_详解python3中socket套接字的编码问题解决

    一.TCP 1.tcp服务器创建 #创建服务器 from socket import * from time import ctime #导入ctime HOST = '' #任意主机 PORT = ...

  5. java static 函数_详解java中的static关键字

    Java中的static关键字可以用于修饰变量.方法.代码块和类,还可以与import关键字联合使用,使用的方式不同赋予了static关键字不同的作用,且在开发中使用广泛,这里做一下深入了解. 静态资 ...

  6. mysql数据库中count的作用_详解 MySQL中count函数的正确使用方法

    1. 描述 在MySQL中,当我们需要获取某张表中的总行数时,一般会选择使用下面的语句 select count(*) from table; 其实count函数中除了*还可以放其他参数,比如常数.主 ...

  7. c语言中双冒号意思_详解C++中的双冒号 ::

    C++中的双冒号 ::第一种,类作用域,用来标明类的变量.函数 Human::setName(char* name); 第二种,命名空间作用域,用来注明所使用的类.函数属于哪一个命名空间的 std:: ...

  8. python3中unicode怎么写_详解python3中ascii与Unicode使用

    这篇文章主要为大家详解python3中ascii与Unicode使用的相关资料,需要的朋友可以参考下# Auther: Aaron Fan ''' ASCII:不支持中文,1个英文占1个字节 Unic ...

  9. python dataframe loc函数_详解pandas DataFrame的查询方法(loc,iloc,at,iat,ix的用法和区别)...

    在操作DataFrame时,肯定会经常用到loc,iloc,at等函数,各个函数看起来差不多,但是还是有很多区别的,我们一起来看下吧. 首先,还是列出一个我们用的DataFrame,注意index一列 ...

最新文章

  1. linux命令行下的ftp 多文件下载和目录下载
  2. Java线程详解(11)-线程池
  3. 下列说法正确的是( )
  4. XAML中格式化日期
  5. echart实例数据 本地加载_JVM 类加载概述
  6. Centos 下PHP编译安装fileinfo扩展
  7. 回车键提交与不提交表单的解决方法
  8. iOS开发之$ pod setup时,CocoaPods报CocoaPods was not able to update the `master` repo.
  9. hp服务器 raid卡驱动安装系统,hp 服务器 linux raid驱动
  10. 小程序毕设作品之微信校园维修报修小程序毕业设计成品(4)开题报告
  11. python forward函数___call__、__init__和 forward三个函数在python中的调用方法
  12. shell脚本实现猜大小游戏
  13. [基本功]分类模型评价标准
  14. 单片机(STC系列8051内核单片机)
  15. 微信开发之使用第三方图文编辑器
  16. 关于Java反射获取静态属性值的方式
  17. karas报错filename = 'fine_tuned_net.h5', file descriptor = 24, errno = 28, error message = 'No space l
  18. python音乐下载器交互界面设计_用python实现的百度音乐下载器-python-pyqt-改进版...
  19. 《童虎学习笔记》5分钟了解Citus核心系统表
  20. byte数组转blob类型_Jfinal 存byte[] 到mysql数据库中blob类型

热门文章

  1. 三、敏感信息泄露漏洞
  2. 计算机主板上包含总线,计算机三级(PC技术)笔试106.doc
  3. Linux循环中累计数据,linux shell 读取for循环中出现难处理的数据之单引号错误实例...
  4. SQS 和 SNS 对比分析
  5. 交通运输走向净零的旅程:替代燃料汽车对实现气候目标至关重要
  6. 今年考研的几个变化 务必注意!
  7. python 如何进行mock测试
  8. 1. 大数据 机器学习 深度学习 推荐系统 学习路线
  9. Btrace使用入门
  10. STC15F104W PWM 调光