python dataframe索引_pandas DataFrame 行列索引及值的获取的方法
pandas DataFrame是二维的,所以,它既有列索引,又有行索引
上一篇里只介绍了列索引:
import pandas as pd
df = pd.DataFrame({'A': [0, 1, 2], 'B': [3, 4, 5]})
print df
# 结果:
A B
0 0 3
1 1 4
2 2 5
行索引自动生成了 0,1,2
如果要自己指定行索引和列索引,可以使用 index 和 column 参数:
这个数据是5个车站10天内的客流数据:
ridership_df = pd.DataFrame(
data=[[ 0, 0, 2, 5, 0],
[1478, 3877, 3674, 2328, 2539],
[1613, 4088, 3991, 6461, 2691],
[1560, 3392, 3826, 4787, 2613],
[1608, 4802, 3932, 4477, 2705],
[1576, 3933, 3909, 4979, 2685],
[ 95, 229, 255, 496, 201],
[ 2, 0, 1, 27, 0],
[1438, 3785, 3589, 4174, 2215],
[1342, 4043, 4009, 4665, 3033]],
index=['05-01-11', '05-02-11', '05-03-11', '05-04-11', '05-05-11',
'05-06-11', '05-07-11', '05-08-11', '05-09-11', '05-10-11'],
columns=['R003', 'R004', 'R005', 'R006', 'R007']
)
data 参数为一个numpy二维数组, index 参数为行索引, column 参数为列索引
生成的数据以表格形式显示:
R003 R004 R005 R006 R007
05-01-11 0 0 2 5 0
05-02-11 1478 3877 3674 2328 2539
05-03-11 1613 4088 3991 6461 2691
05-04-11 1560 3392 3826 4787 2613
05-05-11 1608 4802 3932 4477 2705
05-06-11 1576 3933 3909 4979 2685
05-07-11 95 229 255 496 201
05-08-11 2 0 1 27 0
05-09-11 1438 3785 3589 4174 2215
05-10-11 1342 4043 4009 4665 3033
下面说下如何获取DataFrame里的值:
1.获取某一列: 直接 ['key']
print(ridership_df['R003'])
# 结果:
05-01-11 0
05-02-11 1478
05-03-11 1613
05-04-11 1560
05-05-11 1608
05-06-11 1576
05-07-11 95
05-08-11 2
05-09-11 1438
05-10-11 1342
Name: R003, dtype: int64
2.获取某一行: .loc['key']
print(ridership_df.loc['05-01-11'])
# 或者
print(ridership_df.iloc[0])
# 结果:
R003 0
R004 0
R005 2
R006 5
R007 0
Name: 05-01-11, dtype: int64
3.获取某一行某一列的某个值:
print(ridership_df.loc['05-05-11','R003'])
# 或者
print(ridership_df.iloc[4,0])
# 结果:
1608
4.获取原始的numpy二维数组:
print(ridership_df.values)
# 结果:
[[ 0 0 2 5 0]
[1478 3877 3674 2328 2539]
[1613 4088 3991 6461 2691]
[1560 3392 3826 4787 2613]
[1608 4802 3932 4477 2705]
[1576 3933 3909 4979 2685]
[ 95 229 255 496 201]
[ 2 0 1 27 0]
[1438 3785 3589 4174 2215]
[1342 4043 4009 4665 3033]]
*注意在这过程中,数据格式如果不一致,会发生转换.
一个综合栗子:
从 ridership_df 找出第一天里客流量最多的车站,然后返回这个车站的日平均客流,以及返回所有车站的平均日客流,作为对比:
def mean_riders_for_max_station(ridership):
max_index = ridership.iloc[0].argmax()
mean_for_max = ridership[max_index].mean()
overall_mean = ridership.values.mean()
return (overall_mean, mean_for_max)
print mean_riders_for_max_station(ridership_df)
# 结果:
(2342.6, 3239.9)
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。
python dataframe索引_pandas DataFrame 行列索引及值的获取的方法相关推荐
- python空值填充_pandas | DataFrame基础运算以及空值填充
今天是pandas数据处理专题的第四篇文章,我们一起来聊聊DataFrame的基本运算. 上一篇文章当中我们介绍了DataFrame数据结构当中一些常用的索引的使用方法,比如iloc.loc以及逻辑索 ...
- python iloc用法_pandas.DataFrame.loc和.iloc用法详解
.loc[ ]与.iloc[ ]用法详解 目录 pandas.DataFrame.loc pandas.DataFrame.iloc 注意 通过.loc[ ]或者.iloc[ ]获取数据时需要注 ...
- python cut函数_Pandas DataFrame.cut()用法例子
本文概述 当需要将数据值分段并将其分类到bin中时, 将调用cut()方法.它用于将连续变量转换为分类变量.它还可以将元素数组分离到单独的容器中.该方法仅适用于一维数组状对象. 如果我们有大量标量数据 ...
- pythonpandas设置索引_pandas DataFrame的修改方法(值、列、索引)
对于DataFrame的修改操作其实有很多,不单单是某个部分的值的修改,还有一些索引的修改.列名的修改,类型修改等等.我们仅选取部分进行介绍. 一.值的修改 DataFrame的修改方法,其实前面介绍 ...
- pandas 设置多重索引_pandas dataframe多重索引常用操作
增加(创建) df1=pd.DataFrame(np.arange(12).reshape(4,3),index=[list("AABB"),[1,2,1,2]],columns= ...
- python replace函数_Pandas DataFrame.replace()用法
本文概述 Pandas replace()是一个非常丰富的函数, 用于从DataFrame替换字符串, 正则表达式, 字典, 列表和序列. DataFrame的值可以动态替换为其他值.它能够使用Pyt ...
- python测试自动化封装_python接口自动化学习笔记(封装获取测试数据方法)
本篇文章是接于python接口自动化学习笔记(封装方法用于读取excel) 后的拓展,讲解在封装完成excel的数据读取代码后,如何在data层进行使用 首先,我准备了这样一个excel表格用以存储测 ...
- python字典按照key排序_python中字典按key值排序的实现方法
之前小编介绍了字典本身不可排序,但按值可以,小编也介绍了按value值排序的三种方法.sorted()函数可以对数字或字符串进行排序,按key排序只是输出的key值的排序列表,使用sorted()函数 ...
- python visual studio pandas_pandas DataFrame索引行列的实现
python版本: 3.6 pandas版本: 0.23.4 行索引 索引行有三种方法,分别是 loc iloc ix import pandas as pd import numpy as np i ...
最新文章
- 环境微生物期刊—mBio介绍
- Java实现读取pdf文件内容(how to read pdf in java)
- Linux curl与wget 命令的区别和联系
- 《当程序员的那些狗日日子》(三十六)无名的配角
- 断开的管道 java.io.IOException: Broken pipe 解决方法
- 性能测试系列:Jmeter使用记录
- Tampermonkey 实现 csdn 免登陆复制
- vue2.0分页组件,
- 北京上海开车遇加塞,像个人行不行?!
- Excel中输入身份证号后三位变成0的情况处理如下
- 有人痴狂,有人跑路,开源软件新一年的冰火两重天
- EAP设备自动化系统基本功能与概念
- Powershell运行脚本异常:无法加载文件...因为在此系统上禁止运行脚本
- webRTC(十四):webrtc 端到端文本聊天
- 快讯:湘江实验室在长沙揭牌成立;中国移动算网升级3AZ重磅发布
- JavaScript-事件高级
- android实现调用科大讯飞语音识别功能详细步骤
- 计算机综合应用实训是什么意思,计算机综合应用能力实训报告.doc
- 感受大自然帶給我們的愉悅心情
- C语言 几点几分了?
热门文章
- Oracle 10g 用户数及价格
- Myeclipse7.X和8.X汉化
- Item 39. 异常安全之函数(Exception Safe Functions)
- [转]MVC+JQuery validate实现用户输入验证
- mac安装 配置 ant
- [转]httpclient 上传文件、下载文件
- C/C++ 存储类型 作用域 连接类型
- 建立windows2003 域名服务器
- 通过路由器的IP映射来解决,两个不同IP地址的PC机之间的从LAN口到WAN口的单向通讯问题
- jenkins构建后接受者收不到邮件问题解决方案