python异常数据筛选_学习笔记(06):Python数据清理实践-数据过滤,06Python,清洗,实战,筛选...
数据筛选:直接引用,选择行列,基础索引,loc和iloc,如何区分
import三个库:pandas as pd,os, numpy as np
os.chdir(‘数据存放路径’)
读取 变量 = pd.read_csv(‘文件名称’, encoding=‘’,dtype= {‘某一列名’:str})
df.info
()对数据进行简单的探索,比如多少行,多少变量,每个column数据类型等
df.head () 查看下数据前几行是什么样子的
df.columns 是数据的列名称,也叫变量名称或者叫数据的字段
如果只想要一列,简单索引方式:df【‘列名’】但是如果要两列,就要以嵌套列表的形式df[[‘列名1’,’列名2’]].head(5)这里是显示前五行的意思。取多个字段要写两层。如果只想要第二行到第五行就[1:5]这里是左闭右开,因此是包含1但不包含5,第二行到第五行
loc只能选标签,比如loc[3:4]就会把索引标签为3的和索引标签为4的给取出来,loc定义的是标签,也就是这里的3和4不再是位置而是标签了
如果不想选择行但是想选择列,并以列表形式传递进去。则:loc[:,[‘列名1’,’列名2’]].head(10)查看前十行
如果行标签1-3的选出来,列标签如上述,则:loc[1:3,[‘列名1’,’列名2’]]
df.loc还能接条件,比如我们要取某一列中某一个确定的值的那一行数据:df.loc[df.列名=‘某值’]这里后面还可以接我们的变量:df.loc[df.列名=‘某值’,[‘列名1’,’列名2’]]
如果定义取哪个名称的列标签数据时出错,可以试着写两个等号:== 举例:变量名.loc = 变量名.列名==“一个列标签名”,[“刚才那个列名”,”其他列名”]
&:and
|:or
因此还可以加其他条件 比如 变量名.loc = [变量名.列名1==(“一个列标签名”) | (列名2>3) ,[“列名1”,”列名2”]]
因此loc语句第一个参数都是对行操作,第二个参数才是对列操作
所以:只想对行操作对列不做限制就写成这种形式:loc[3:4]
只想对列操作,对行不做限制就是这样:loc[:,[‘列名1’,’列名2’]]
然后看iloc:loc选择的是标签而iloc选择的是位置!!
因此
loc[3:4]就会把索引标签为3的和索引标签为4的给取出来,loc定义的是标签,也就是这里的3和4不再是位置而是标签了
变量名.iloc[1:3]会显示行标签为1和2的数据,因为这里1代表第二行,3因为左包右开因此指取到不包括第四行,也就是第三行的数据。
iloc[:,1:4]只对行不做限制,列则是取第二列到第四列
但是假设我们只要第一列和第三列怎么办?把它以列表的形式传递进去就行:iloc[:,[0,2]]
前面行也可以这样写:行要第二行和第十一行列要第一列和第三列:
iloc[[1,10],[0,2]]
python异常数据筛选_学习笔记(06):Python数据清理实践-数据过滤,06Python,清洗,实战,筛选...相关推荐
- 数据之道读书笔记-06面向“自助消费”的数据服务建设
数据之道读书笔记-06面向"自助消费"的数据服务建设 数据底座建设的目标是更好地支撑数据消费,在完成数据的汇聚.整合.联接之后,还需要在供应侧确保用户更便捷.更安全地获取数据.一方 ...
- 《R数据科学》学习笔记|Note8:使用dplyr处理关系数据
使用dplyr处理关系数据 往期文章 <R数据科学>学习笔记|Note1:绪论 <R数据科学>学习笔记|Note2:使用ggplot2进行数据可视化(上) <R数据科学& ...
- python爬取b站视频封面_学习笔记(4)[Python爬虫]:爬取B站搜索界面的所有视频的封面...
学习笔记(4)[Python爬虫]:爬取B站搜索界面的所有视频的封面 import os import requests import re import json from bs4 import B ...
- 学习笔记(06):Python网络编程并发编程-在简单套接字基础上加上通信循环
立即学习:https://edu.csdn.net/course/play/24458/296235?utm_source=blogtoedu 1.服务器端 #以打电话通讯为例子进行说明 #导入相应的 ...
- python三菱modbus解密_学习笔记python-modbus rtu的实现
需求:通过modbus协议,从各类传感器获取数据,实时显示测得的数据. 1)需要先安装python依赖包pyserial和pymodbus_tk. 安装方法:cmd里直接运行 pip install ...
- python绘制热力地图_Python学习笔记:Python做热力地图
输入win+R然后输入cmd回车,出现DOS界面 命令行上输入:pip install folium,然后如果出现successfully的话则代表你安装成功. 数据我已经上传百度云,大家只要设置好环 ...
- 正则表达式在python中的应用_学习正则表达式在python中的应用
目的:对文本的处理,正则表达式的功能很强大,可以很巧妙的过滤.匹配.获取想要的字符串,是必须学习的技能,这里只记录常用的写法,详细文档可以参看官方帮助文档. 环境:ubuntu 16.04 pytho ...
- 大数据Hadoop教程-学习笔记01【大数据导论与Linux基础】
视频教程:哔哩哔哩网站:黑马大数据Hadoop入门视频教程,总时长:14:22:04 教程资源:https://pan.baidu.com/s/1WYgyI3KgbzKzFD639lA-_g,提取码: ...
- 大数据Hadoop教程-学习笔记02【Apache Hadoop、HDFS】
视频教程:哔哩哔哩网站:黑马大数据Hadoop入门视频教程 教程资源:https://pan.baidu.com/s/1WYgyI3KgbzKzFD639lA-_g 提取码: 6666 [P001-P ...
最新文章
- bcd转ascii码 流程图_4-20mA转RS485,MODBUS数据采集模块
- 深度学习——常用数据标注工具总结
- U盘Linux游戏系统,batocera.linux U盘街机游戏系统下载
- 【Python】使用分隔符拆分字符串
- 个人博客html页面,51个漂亮的个人博客和自媒体网站
- java foreach循环语句_Javaforeach语句
- 故宫元宵节首开夜场,票务系统HTTPS加密护航 1
- 码农必备,一款超好用Json编辑工具
- 修改计算机基本信息,windows10系统下怎样更改基本信息中的制造商型号
- 医学界的动作捕捉系统(二)
- JavaWeb解决form表单刷新提示确认重新提交表单
- 文明旅游深入人心,如何通过视频监控系统进一步加强旅游景区管制?
- Android蓝牙BLE开发(一)-基本原理
- SpringBoot 生成数据库设计文档工具
- java号段_Java匹配国内手机号码段
- Win7/Win8.1新装备:谷歌推64位Chrome测试版
- 13年android手机top,2013年12月热门Android机型盘点
- 11个中最大的10个数字
- 教你准确判断两个结构体是否相等
- MySQL面试必知必备必会50题(含代码)的测试表构建信息
热门文章
- UG二次开发GRIP创建注释
- 解决0xc000012f 损坏的映像rasman.dll没有被指定在windows运行问题
- VF01开票BAPI
- photoshop将图层导出到文件脚本不带数字序号、下划线方法
- Android实现类似股票列表联动
- drop 很慢 物化视图_clickhouse 物化视图的踩坑记录
- 40 张最全计算机网络基础思维导图
- No module named ‘skimage‘的问题及解决
- Simulink仿真设置和Scope示波器的使用[方案]
- 设计模式-实习期笔记