Pandas库的基本使用方法
Pandas库的基本使用方法
- 生成二维数组
- 文件的读取与写入
- 文件的写入
- 文件的读取
- 数据的一些预处理
- 1.拆分,合并和分组计算
- 2.数据的选取与清洗
生成二维数组
例:生成服从标准正态分布的24乘4随机矩阵,行名为20191101到20191124,列名为A,B,C,D并保存为dataframe数据结构
import pandas as pd
import numpy as np
dates=pd.date_range(start="20191101",end="20191124",freq="D")#生成一组时间序列数据
a=pd.DataFrame(np.random.randn(24,4),index=dates,columns=list('ABCD'));a
文件的读取与写入
文件的写入
这里有csv和xlsx两种格式
a.to_excel("dataframe.xlsx")
a.to_csv("dataframe1.csv")
或者:
f=pd.ExcelWriter("data.xlsx")
a.to_excel(f,'sheet1')
b=a+1
b.to_excel(f,'sheet2')
f.save()
这样就能在一个excel中看到两个表格:
文件的读取
c=pd.read_csv("dataframe1.csv",usecols=range(1,5))#读取文件并展示行名
d=pd.read_excel("data.xlsx",'sheet2',usecols=range(1,5))#读取文件的第二个表格并展示行名
数据的一些预处理
1.拆分,合并和分组计算
import pandas as pd
import numpy as np
dates=pd.date_range(start="20191101",end="20191124",freq="D")#生成一组时间序列数据
d=pd.DataFrame(np.random.randn(24,4),index=dates,columns=list('ABCD'));a
d1=d[:4]#获取数据的前四行数据
d2=d[4:]#读取数据五行以后的数据
d3=pd.concat([d1],[d2])#合并行数据
s1=d.groupby("A").mean()#数据分组求均值
s2=d.groupby("A").apply(sum)#s数据分组求和
2.数据的选取与清洗
import pandas as pd
import numpy as np
data=pd.DataFrame(np.random.randint(1,3,(3,3)),index=["m","v","p"],columns=["one",'two','three'])
data.loc['m','one']=np.nan#修改第一行第一列的数据为空值
data.iloc[1:3,0:2]#提取数据的第2到3行,第1到2列
data["four"]="shit"#增加第四列数据
a2=data.reindex(["m",'v','p'])
a2.dropna()#删除有不确定的值
a2
参考文章:https://book.douban.com/subject/35066598/
Pandas库的基本使用方法相关推荐
- 利用pandas库中的read_html方法快速抓取网页中常见的表格型数据
利用pandas库中的read_html方法快速抓取网页中常见的表格型数据 本文转载自:https://www.makcyun.top/web_scraping_withpython2.html 需要 ...
- pandas库中unique函数方法
pandas库中unique方法 (1)函数介绍 unique方法可以进行对于一列数据进行去重,并返回所有不同的值.如我们对数据集的标签页进行使用该函数,就可以输出一共有多少种标签类型. (2)代码 ...
- Python数据分析~Pandas库30分钟快速入门
目录 1 Pandas序列和数据表 2 Pandas数据聚合与分组运算 3 Pandas数据可视化 Pandas库在数据分析中是非常重要和常用的库,它利用数据框让数据的处理和操作变的简单和快捷.在数 ...
- 数据分析二、pandas库数据处理
数据处理 一.数据清洗 数据清洗的三个步骤 1.1处理缺失值 1.1.1查找数据中的缺失值 1.1.2删除缺失值 dropna() (德普纳) 1.1.3 1.2处理重复值 第一步:1.2.1查找重复 ...
- 【Pandas库】(3) DataFrame的创建方法及基本操作
各位同学好,今天给大家介绍一下Pandas库中DataFrame类型数据的创建方法和基本操作. 文章内容如下: (1)使用字典类创建. 字典类有:①数组.列表.元组构成的字典:②Series构造的字典 ...
- 【Pandas库】(1) Series的创建方法
各位同学大家好,今天和大家分享一下Pandas库中Series的创建方法. 文章主要介绍了使用 列表.数组.字典 三种方法创建Series. 介绍了 如何查看Series索引和值.如何让使用字典生成的 ...
- Py之Pandas:Python的pandas库简介、安装、使用方法详细攻略
Py之Pandas:Python的pandas库简介.安装.使用方法详细攻略 目录 pandas库简介 pandas库安装 pandas库使用方法 1.函数使用方法 2.使用经验总结 3.绘图相关操作 ...
- python如何安装panda数据库_在Pycharm中安装Pandas库方法(简单易懂)
开发环境的搭建是一件入门比较头疼的事情,在上期的文稿基础上,增加一项Anaconda的安装介绍.Anaconda是Python的一个发行版本,安装好了Anaconda就相当于安装好了Python,并且 ...
- string.split方法 保留分隔符_Python pandas库159个常用方法使用说明
Pandas库专为数据分析而设计,它是使Python成为强大而高效的数据分析环境的重要因素. 一.Pandas数据结构 1.import pandas as pd import numpy as np ...
- Pandas库常用函数和操作
目录 1. DataFrame 处理缺失值 dropna() 2. 根据某维度计算重复的行 duplicated().value_counts() 3. 去重 drop_duplicates( ...
最新文章
- 台式计算机刚换的显示屏怎么设置,台式机怎么样切换显示器
- v3 微信api 请求微信_企业微信API使用基本教程
- 到底应该加几个卷积核?
- linux命令(常用)
- 图解HashMap(一)
- OC本学习笔记Foundation框架NSString与NSMutableString
- eclipse快速定位到错误处
- 计算机组组内培训记录,计算机教研组活动记录.doc
- Java反射 Class类
- pytorch学习笔记(十):MLP
- atitit.基于bat cli的插件管理系统.doc
- 使用Excel功能抓取网页表格数据
- LaTeX符号大全-基于lshort-zh-cn
- android多屏幕共享,一种实现多人屏幕无线共享的方法技术
- 两圆的外切线与内切线的切点算法
- SpringBoot自动化配置原理
- python系统编程培训
- Linux服务器通过X11实现图像化界面显示
- 超时用集群脚本ync.sh、xcall.sh
- 双路微型计算机,十二核心至尊 Intel Xeon E5-2697 v2