本文是基于Windows系统环境,学习和测试pandas模块:

Windows 10

PyCharm 2018.3.5 for Windows (exe)

python 3.6.8 Windows x86 executable installer

1. 读取csv/txt文件

读取txt文件,设置分隔符为‘,’,设置是否跳过第一行

import pandas as pd
data = pandas.read_csv('test.txt', sep=',', header=None)
print(data)

  

读取某一行

import pandas as pd
data = pandas.read_csv('test.txt')
index = 3
printf(data.ix[index]) # 读取第三行

  

读取某一列

import pandas as pd
data = pandas.read_csv('test.txt')
printf(data['ID']) # 读取属性名为ID的列,区分大小写

  

读取前5行

import pandas as pd
data = pd.read_csv('user.csv')
data.head(5) # 获取前5行

  

2. 基本操作

删除/选取某列含有特殊数值的行

import pandas as pd
data = pd.read_csv('user.csv')
print(data)
#删除/选取某列含有特定数值的行
#data[data['A'].isin([1])]  # 选取df1中A列包含数字1的行
data=data[~data['A'].isin([1])] # 通过~取反,选取不包含数字1的行
print(data)

  

删除/选取某行含有特殊数值的列

cols=[x for i,x in enumerate(df2.columns) if df2.iat[0,i]==3]
#利用enumerate对row0进行遍历,将含有数字3的列放入cols中
print(cols)
#df2=df2[cols]   选取含有特定数值的列
df2=df2.drop(cols,axis=1) #利用drop方法将含有特定数值的列删除
print(df2)

  

删除含有空值的行或列

import pandas as pd
import numpy as np
df1 = pd.DataFrame([[np.nan, 2, np.nan, 0],[3, 4, np.nan, 1],[np.nan, np.nan, np.nan, 5],[np.nan, 3, np.nan, 4]],columns=list('ABCD'))
print(df1)
df2=df1.copy()
df1['A']=df1['A'].fillna('null') #将df中A列所有空值赋值为'null'
print(df1)
df1=df1[~df1['A'].isin(['null'])]
print(df1)
#删除某行空值所在列
df2[0:1]=df2[0:1].fillna('null')
print(df2)
cols=[x for i,x in enumerate(df2.columns) if df2.iat[0,i]=='null']
print(cols)
df2=df2.drop(cols,axis=1)
print(df2)

  

3. 统计分析

打印统计详细信息

import pandas as pd
data = pd.read_csv('user.csv')
print (data.describe()) # 打印详细信息

  

统计中值

import pandas as pd
data = pd.read_csv('user.csv')
print (data['userAge'].median()) # 统计userAge这一列的中值

  

统计某一列不重复的值

import pandas as pd
data = pd.read_csv('user.csv')
print (data['userName'].unique()) #打印某一列不重复的值

  

4. 异常处理

中值填充缺失值

import pandas as pd
data = pd.read_csv('user.csv')
data['userAge'] = data['userAge'].fillna(data['userAge'].median())

 

原文:https://blog.csdn.net/qq_32599479/article/details/89361693

转载于:https://www.cnblogs.com/qbdj/p/11041211.html

Python中的pandas模块学习相关推荐

  1. python使用教程cmd啥意思-Python 中的cmd模块学习

    Python中的cmd模块类型提供了一个创建命令行解析器的框架.简单的来说,可以继承Cmd来创建命令行界面,然后对所有想处理的命令command执行do_command方法.默认情况下,它使用read ...

  2. python中的glob 模块学习文件路径查找

    glob glob.glob(pathname), 返回所有匹配的文件路径列表.它只有一个参数pathname,定义了文件路径匹配规则,这里可以是绝对路径,也可以是相对路径. import glob ...

  3. 【Python2】使用python中的turtle模块学习海龟绘图(有趣的python初体验)(最全最详细的turtle介绍使用)

    目录 海龟绘图 Python中tkinter的mainloop函数实质 turtle模块里的方法 Python绘图Turtle库详解 turtle绘图的基础知识: 海龟绘图 海龟绘图是Python中非 ...

  4. Python中re(正则表达式)模块学习

    re.match re.match 尝试从字符串的开始匹配一个模式,如:下面的例子匹配第一个单词. import re text = "JGood is a handsome boy, he ...

  5. python中的random模块学习

    我将random模块中的各函数作为代码中的注释说明了: 下面是运行结果 参考文献 http://www.jb51.net/article/50066.htm

  6. 使用python中的tkinter模块制作一个学习打卡小软件

    学习任务打卡小软件---戈多Sensei 1.制定任务 2.完成任务 3.学习评估 最近为了给我的星星⭐写一个学习记录软件,学习了一下python中的tkinter模块,做了一个可视化打卡界面,此处为 ...

  7. python 去除panda安装包_沉淀,再出发:python中的pandas包

    沉淀,再出发:python中的pandas包 一.前言 python中有很多的包,正是因为这些包工具才使得python能够如此强大,无论是在数据处理还是在web开发,python都发挥着重要的作用,下 ...

  8. python中的numpy模块

    参考  python中的numpy模块 - 云+社区 - 腾讯云 目录 NumPy 教程 学习本教程前你需要了解 NumPy 应用 相关链接 NumPy 安装 1.使用已有的发行版本 2.使用 pip ...

  9. pandas 模块学习

    2019独角兽企业重金招聘Python工程师标准>>> pandas模块 方法有两个 1.在windows下安装pandas,只安装pandas一个包显然是不够的,它并没有把用到的相 ...

最新文章

  1. Golang 学习笔记资源
  2. greenPlum资源隔离
  3. 解决项目莫名奇妙的报错问题
  4. java单例模式 参数_java中的几种单例模式
  5. 为什么我十分喜欢C,却很不喜欢C++
  6. Python网页爬虫之中文乱码
  7. keras ImageDataGenerator数据增强
  8. RINEX 3.02版本文件格式介绍
  9. UG应用标准库遇到 当前搜索选项查文件失败,部件已卸载
  10. matlab opnet,opnet环境变量和matlab联调心得
  11. Laravel之队列
  12. 用增广矩阵的秩判断N线性方程的解的个数
  13. 第8周项目5:定期存款利息计算器
  14. 切换笔记本外接显示屏 屏幕显示的快捷键
  15. 前端牛客网刷题总结【 JS基础变量、数据类型、数据类型转换、运算符等】
  16. 2012年陈乔恩主演都市胜女华丽猎爱偶像剧-胜女的代价
  17. RS485总线灵魂问答,看你知道几个?
  18. 文献阅读-Clinical and Biological subtypes of B-cell lymphoma revealed by microenvironment signature
  19. 【AHOI2009】【BZOJ1800】fly 飞行棋
  20. 0.2度背后的美国抉择:压不住新能源

热门文章

  1. C++访问属性和继承属性浅析
  2. 2018-1-8 Linux学习笔记
  3. jquery初始化的三种方式
  4. Mac写文件到U盘的方法
  5. MATLAB与C#混合编程
  6. [转载]Python方法绑定——Unbound/Bound method object的一些梳理
  7. Mirror--如何在主库上增加文件
  8. 冒号课堂§4.3:汇总范式
  9. python 实现str list array tuple的互换以及join函数的使用
  10. 突然想到一个可以减少fc层权重数的方法