DataFrame切片
知乎上的一个总结
. 取行的同时,也取列。一个原则是行偷懒的方式和列偷懒的方式都不能用了。必须用.loc或.iloc。
第一种情况是列索引用数字表示, df.iloc[行索引表达,列索引表达],规则跟上面行索引一模一样。
testdf3.iloc[[1,3],[0]] # dataframe
testdf3.iloc[[1,3],0] # series
testdf3.iloc[[1,3],1:3] # dataframe
testdf3.iloc[[1,3],[1,3]]
第二种情况是列索引直接引列名(行索引不存在这个问题,因为pandas没有所谓’行名’),就要用df.loc[行索引,列名索引。
testdf3.loc[1,[“A”,“D”]] # series 对应上述1.1
testdf3.loc[[1],[“A”,“D”]] # df 对应上述1.1
testdf3.loc[[1,3],“A”:“D”] # df 对应上述1.2
testdf3.loc[[1,3],[“A”,“D”]] # df 对应上述1.3
编辑于 2018-11-08
几乎所有的切片操作都可以归结为一种方式
df.loc/iloc[[ A ],[ B ]],
A为列表时指不连续切片,中间有冒号时为连续切片,B同理
1.2 第二种情况是取连续的某几行。用df.iloc[行号:行号],也可以偷懒用df[行号:行号]。得到的都是df.
testdf3[2:3] # data frame
testdf3.iloc[2:3] # data frame
1.3 第三种情况是不连续的多行,则是df.iloc[[行号,行号]],注意是两个方括号。得到的是df。
testdf3.iloc[[1,3]]
2.1 只取一列,可以偷懒不用.loc
testdf3[‘A’] # 单独一列是个series
testdf3.loc[:,‘A’] # 同上,但比较复杂,一般不用
testdf3.iloc[:,0] # 同上,可以在不知道列名的时候用
testdf3[[‘A’]] #单独一列是个df
testdf3.loc[:,[‘A’]] # 同上,但比较复杂,一般不用
testdf3.iloc[:,[0]] # 同上,可以在不知道列名的时候用
2.2 取指定的某几列,可以偷懒不用.loc
testdf3[[‘A’,‘C’]] # DF, 指定某几列,直接用列名
testdf3.loc[:,[‘A’,‘C’]] # 同上,但比较复杂,一般不用
testdf3.iloc[:,[0,2]] # 同上,可以在不知道列名的时候用
只取行和列的情况,只取行时可以省略列,只取列时前面必须要有冒号,连续或不连续同理
DataFrame切片相关推荐
- python dataframe切片_python pandas dataframe 行列选择,切片操作方法
SQL中的select是根据列的名称来选取:Pandas则更为灵活,不但可根据列名称选取,还可以根据列所在的position(数字,在第几行第几列,注意pandas行列的position是从0开始)选 ...
- dataframe中多列除以不同列_Python之DataFrame切片与索引实验
创建2个DataFrame,一个没有行列命名,一个有行列名.来进行常规切片.loc/iloc索引.布尔索引的对比试验. 1.使用Numpy和pandas创建两个DataFrame 之前别忘了导入Num ...
- dataframe切片_Kaggle:识别淋巴结病理切片有无癌细胞(logistic+svm+rf+CNN)
介绍 目的:识别淋巴结病理切片有无癌细胞 数据:Histopathologic Cancer Detection(鉴别淋巴结病理切片有无癌细胞),为图像二分类数据集 (图片大小 ),来自 Kaggle ...
- dataframe 切片_NumPy中的ndarray与Pandas的Series和DataFrame之间的区别与转换
在数据分析中,经常涉及numpy中的ndarray对象与pandas的Series和DataFrame对象之间的转换,让一些开发者产生了困惑.本文将简单介绍这三种数据类型,并以金融市场数据为例,给出相 ...
- python dataframe切片_python-如何避免“试图在DataFrame的切片副本上设置值”?
我有一个数据框df_original: a b 0 10 5 1 12 6 2 14 1 现在,我想制作一个包含所有行的新数据框,其中c> 5,然后在此新数据帧上设置新的列值: df = df_ ...
- 【pandas-汇总3】DataFrame常用属性、函数以及索引方式
1.DataFrame常用属性.函数以及索引方式 1.1DataFrame简介 DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值.字符串.布尔值等).Data ...
- 再见 for 循环!pandas 提速 315 倍~
for是所有编程语言的基础语法,初学者为了快速实现功能,依懒性较强.但如果从运算时间性能上考虑可能不是特别好的选择. 本次东哥介绍几个常见的提速方法,一个比一个快,了解pandas本质,才能知道如何提 ...
- python Pandas SettingwithCopy 警告解决方案
原文链接:https://www.dataquest.io/blog/settingwithcopywarning/ 原文标题:Understanding SettingwithCopyWarning ...
- 成功解决pandas\core\indexing.py:179: SettingWithCopyWarning: A value is trying to be set on a copy of a
成功解决pandas\core\indexing.py:179: SettingWithCopyWarning: A value is trying to be set on a copy of a ...
- 成功解决pandas\core\frame.py:2754: SettingWithCopyWarning: A value is trying to be set on a copy of a s
成功解决pandas\core\frame.py:2754: SettingWithCopyWarning: A value is trying to be set on a copy of a s ...
最新文章
- 信息系统项目管理师优秀论文:项目进度管理
- DCMTK:TLS测试DcmSCP和DcmSCPPool类
- 如何写出让人抓狂的代码?
- Magento 1.9.X 系列教程
- wxpython textctrl_wxPython TextCtrl类
- HDU 4873 ZCC Loves Intersection(可能性)
- 2021 年前端学习路线总结
- Makima修正Hermite插值
- java SNS网络系统,Java源码:SNS社交管理系统JEESNS v1.3
- Mac连接京瓷打印机Fs-1030MFP/DP
- 【git及GitHub使用总结】(一)
- [转载]全国高校IPv6地址分配情况
- 解决Swing控件setEnabled(false)时的字体颜色
- au能否打开m4a文件_什么是M4V文件(以及如何打开一个文件)?
- 03.服务限流实现方案
- 模电学习5. 耦合电容、去耦电容与旁路电容
- Python爬虫----爬取妹子图片
- 自定义的串口通信协议
- 二本考南方科技大学计算机,南方科技大学是一本还是二本大学
- Kali安装peda