数据筛选:直接引用,选择行列,基础索引,loc和iloc,如何区分

import三个库:pandas as pd,os, numpy as np

os.chdir(‘数据存放路径’)

读取 变量 = pd.read_csv(‘文件名称’, encoding=‘’,dtype= {‘某一列名’:str})

df.info

()对数据进行简单的探索,比如多少行,多少变量,每个column数据类型等

df.head () 查看下数据前几行是什么样子的

df.columns 是数据的列名称,也叫变量名称或者叫数据的字段

如果只想要一列,简单索引方式:df【‘列名’】但是如果要两列,就要以嵌套列表的形式df[[‘列名1’,’列名2’]].head(5)这里是显示前五行的意思。取多个字段要写两层。如果只想要第二行到第五行就[1:5]这里是左闭右开,因此是包含1但不包含5,第二行到第五行

loc只能选标签,比如loc[3:4]就会把索引标签为3的和索引标签为4的给取出来,loc定义的是标签,也就是这里的3和4不再是位置而是标签了

如果不想选择行但是想选择列,并以列表形式传递进去。则:loc[:,[‘列名1’,’列名2’]].head(10)查看前十行

如果行标签1-3的选出来,列标签如上述,则:loc[1:3,[‘列名1’,’列名2’]]

df.loc还能接条件,比如我们要取某一列中某一个确定的值的那一行数据:df.loc[df.列名=‘某值’]这里后面还可以接我们的变量:df.loc[df.列名=‘某值’,[‘列名1’,’列名2’]]

如果定义取哪个名称的列标签数据时出错,可以试着写两个等号:== 举例:变量名.loc = 变量名.列名==“一个列标签名”,[“刚才那个列名”,”其他列名”]

&:and

|:or

因此还可以加其他条件 比如  变量名.loc = [变量名.列名1==(“一个列标签名”) | (列名2>3) ,[“列名1”,”列名2”]]

因此loc语句第一个参数都是对行操作,第二个参数才是对列操作

所以:只想对行操作对列不做限制就写成这种形式:loc[3:4]

只想对列操作,对行不做限制就是这样:loc[:,[‘列名1’,’列名2’]]

然后看iloc:loc选择的是标签而iloc选择的是位置!!

因此

loc[3:4]就会把索引标签为3的和索引标签为4的给取出来,loc定义的是标签,也就是这里的3和4不再是位置而是标签了

变量名.iloc[1:3]会显示行标签为1和2的数据,因为这里1代表第二行,3因为左包右开因此指取到不包括第四行,也就是第三行的数据。

iloc[:,1:4]只对行不做限制,列则是取第二列到第四列

但是假设我们只要第一列和第三列怎么办?把它以列表的形式传递进去就行:iloc[:,[0,2]]

前面行也可以这样写:行要第二行和第十一行列要第一列和第三列:

iloc[[1,10],[0,2]]

python异常数据筛选_学习笔记(06):Python数据清理实践-数据过滤,06Python,清洗,实战,筛选...相关推荐

  1. 数据之道读书笔记-06面向“自助消费”的数据服务建设

    数据之道读书笔记-06面向"自助消费"的数据服务建设 数据底座建设的目标是更好地支撑数据消费,在完成数据的汇聚.整合.联接之后,还需要在供应侧确保用户更便捷.更安全地获取数据.一方 ...

  2. 《R数据科学》学习笔记|Note8:使用dplyr处理关系数据

    使用dplyr处理关系数据 往期文章 <R数据科学>学习笔记|Note1:绪论 <R数据科学>学习笔记|Note2:使用ggplot2进行数据可视化(上) <R数据科学& ...

  3. python爬取b站视频封面_学习笔记(4)[Python爬虫]:爬取B站搜索界面的所有视频的封面...

    学习笔记(4)[Python爬虫]:爬取B站搜索界面的所有视频的封面 import os import requests import re import json from bs4 import B ...

  4. 学习笔记(06):Python网络编程并发编程-在简单套接字基础上加上通信循环

    立即学习:https://edu.csdn.net/course/play/24458/296235?utm_source=blogtoedu 1.服务器端 #以打电话通讯为例子进行说明 #导入相应的 ...

  5. python三菱modbus解密_学习笔记python-modbus rtu的实现

    需求:通过modbus协议,从各类传感器获取数据,实时显示测得的数据. 1)需要先安装python依赖包pyserial和pymodbus_tk. 安装方法:cmd里直接运行 pip install ...

  6. python绘制热力地图_Python学习笔记:Python做热力地图

    输入win+R然后输入cmd回车,出现DOS界面 命令行上输入:pip install folium,然后如果出现successfully的话则代表你安装成功. 数据我已经上传百度云,大家只要设置好环 ...

  7. 正则表达式在python中的应用_学习正则表达式在python中的应用

    目的:对文本的处理,正则表达式的功能很强大,可以很巧妙的过滤.匹配.获取想要的字符串,是必须学习的技能,这里只记录常用的写法,详细文档可以参看官方帮助文档. 环境:ubuntu 16.04 pytho ...

  8. 大数据Hadoop教程-学习笔记01【大数据导论与Linux基础】

    视频教程:哔哩哔哩网站:黑马大数据Hadoop入门视频教程,总时长:14:22:04 教程资源:https://pan.baidu.com/s/1WYgyI3KgbzKzFD639lA-_g,提取码: ...

  9. 大数据Hadoop教程-学习笔记02【Apache Hadoop、HDFS】

    视频教程:哔哩哔哩网站:黑马大数据Hadoop入门视频教程 教程资源:https://pan.baidu.com/s/1WYgyI3KgbzKzFD639lA-_g 提取码: 6666 [P001-P ...

最新文章

  1. bcd转ascii码 流程图_4-20mA转RS485,MODBUS数据采集模块
  2. 深度学习——常用数据标注工具总结
  3. U盘Linux游戏系统,batocera.linux U盘街机游戏系统下载
  4. 【Python】使用分隔符拆分字符串
  5. 个人博客html页面,51个漂亮的个人博客和自媒体网站
  6. java foreach循环语句_Javaforeach语句
  7. 故宫元宵节首开夜场,票务系统HTTPS加密护航 1
  8. 码农必备,一款超好用Json编辑工具
  9. 修改计算机基本信息,windows10系统下怎样更改基本信息中的制造商型号
  10. 医学界的动作捕捉系统(二)
  11. JavaWeb解决form表单刷新提示确认重新提交表单
  12. 文明旅游深入人心,如何通过视频监控系统进一步加强旅游景区管制?
  13. Android蓝牙BLE开发(一)-基本原理
  14. SpringBoot 生成数据库设计文档工具
  15. java号段_Java匹配国内手机号码段
  16. Win7/Win8.1新装备:谷歌推64位Chrome测试版
  17. 13年android手机top,2013年12月热门Android机型盘点
  18. 11个中最大的10个数字
  19. 教你准确判断两个结构体是否相等
  20. MySQL面试必知必备必会50题(含代码)的测试表构建信息

热门文章

  1. UG二次开发GRIP创建注释
  2. 解决0xc000012f 损坏的映像rasman.dll没有被指定在windows运行问题
  3. VF01开票BAPI
  4. photoshop将图层导出到文件脚本不带数字序号、下划线方法
  5. Android实现类似股票列表联动
  6. drop 很慢 物化视图_clickhouse 物化视图的踩坑记录
  7. 40 张最全计算机网络基础思维导图
  8. No module named ‘skimage‘的问题及解决
  9. Simulink仿真设置和Scope示波器的使用[方案]
  10. 设计模式-实习期笔记