Pandas库的基本使用方法

  • 生成二维数组
  • 文件的读取与写入
    • 文件的写入
    • 文件的读取
  • 数据的一些预处理
    • 1.拆分,合并和分组计算
    • 2.数据的选取与清洗

生成二维数组

例:生成服从标准正态分布的24乘4随机矩阵,行名为20191101到20191124,列名为A,B,C,D并保存为dataframe数据结构

import pandas as pd
import numpy as np
dates=pd.date_range(start="20191101",end="20191124",freq="D")#生成一组时间序列数据
a=pd.DataFrame(np.random.randn(24,4),index=dates,columns=list('ABCD'));a

文件的读取与写入

文件的写入

这里有csv和xlsx两种格式

a.to_excel("dataframe.xlsx")
a.to_csv("dataframe1.csv")

或者:

f=pd.ExcelWriter("data.xlsx")
a.to_excel(f,'sheet1')
b=a+1
b.to_excel(f,'sheet2')
f.save()

这样就能在一个excel中看到两个表格:

文件的读取

c=pd.read_csv("dataframe1.csv",usecols=range(1,5))#读取文件并展示行名
d=pd.read_excel("data.xlsx",'sheet2',usecols=range(1,5))#读取文件的第二个表格并展示行名

数据的一些预处理

1.拆分,合并和分组计算

import pandas as pd
import numpy as np
dates=pd.date_range(start="20191101",end="20191124",freq="D")#生成一组时间序列数据
d=pd.DataFrame(np.random.randn(24,4),index=dates,columns=list('ABCD'));a
d1=d[:4]#获取数据的前四行数据
d2=d[4:]#读取数据五行以后的数据
d3=pd.concat([d1],[d2])#合并行数据
s1=d.groupby("A").mean()#数据分组求均值
s2=d.groupby("A").apply(sum)#s数据分组求和

2.数据的选取与清洗

import pandas as pd
import numpy as np
data=pd.DataFrame(np.random.randint(1,3,(3,3)),index=["m","v","p"],columns=["one",'two','three'])
data.loc['m','one']=np.nan#修改第一行第一列的数据为空值
data.iloc[1:3,0:2]#提取数据的第2到3行,第1到2列
data["four"]="shit"#增加第四列数据
a2=data.reindex(["m",'v','p'])
a2.dropna()#删除有不确定的值
a2

参考文章:https://book.douban.com/subject/35066598/

Pandas库的基本使用方法相关推荐

  1. 利用pandas库中的read_html方法快速抓取网页中常见的表格型数据

    利用pandas库中的read_html方法快速抓取网页中常见的表格型数据 本文转载自:https://www.makcyun.top/web_scraping_withpython2.html 需要 ...

  2. pandas库中unique函数方法

    pandas库中unique方法 (1)函数介绍 unique方法可以进行对于一列数据进行去重,并返回所有不同的值.如我们对数据集的标签页进行使用该函数,就可以输出一共有多少种标签类型. (2)代码 ...

  3. Python数据分析~Pandas库30分钟快速入门

    目录 1  Pandas序列和数据表 2 Pandas数据聚合与分组运算 3 Pandas数据可视化 Pandas库在数据分析中是非常重要和常用的库,它利用数据框让数据的处理和操作变的简单和快捷.在数 ...

  4. 数据分析二、pandas库数据处理

    数据处理 一.数据清洗 数据清洗的三个步骤 1.1处理缺失值 1.1.1查找数据中的缺失值 1.1.2删除缺失值 dropna() (德普纳) 1.1.3 1.2处理重复值 第一步:1.2.1查找重复 ...

  5. 【Pandas库】(3) DataFrame的创建方法及基本操作

    各位同学好,今天给大家介绍一下Pandas库中DataFrame类型数据的创建方法和基本操作. 文章内容如下: (1)使用字典类创建. 字典类有:①数组.列表.元组构成的字典:②Series构造的字典 ...

  6. 【Pandas库】(1) Series的创建方法

    各位同学大家好,今天和大家分享一下Pandas库中Series的创建方法. 文章主要介绍了使用 列表.数组.字典 三种方法创建Series. 介绍了 如何查看Series索引和值.如何让使用字典生成的 ...

  7. Py之Pandas:Python的pandas库简介、安装、使用方法详细攻略

    Py之Pandas:Python的pandas库简介.安装.使用方法详细攻略 目录 pandas库简介 pandas库安装 pandas库使用方法 1.函数使用方法 2.使用经验总结 3.绘图相关操作 ...

  8. python如何安装panda数据库_在Pycharm中安装Pandas库方法(简单易懂)

    开发环境的搭建是一件入门比较头疼的事情,在上期的文稿基础上,增加一项Anaconda的安装介绍.Anaconda是Python的一个发行版本,安装好了Anaconda就相当于安装好了Python,并且 ...

  9. string.split方法 保留分隔符_Python pandas库159个常用方法使用说明

    Pandas库专为数据分析而设计,它是使Python成为强大而高效的数据分析环境的重要因素. 一.Pandas数据结构 1.import pandas as pd import numpy as np ...

  10. Pandas库常用函数和操作

    目录 1. DataFrame 处理缺失值  dropna() 2. 根据某维度计算重复的行   duplicated().value_counts() 3. 去重  drop_duplicates( ...

最新文章

  1. 台式计算机刚换的显示屏怎么设置,台式机怎么样切换显示器
  2. v3 微信api 请求微信_企业微信API使用基本教程
  3. 到底应该加几个卷积核?
  4. linux命令(常用)
  5. 图解HashMap(一)
  6. OC本学习笔记Foundation框架NSString与NSMutableString
  7. eclipse快速定位到错误处
  8. 计算机组组内培训记录,计算机教研组活动记录.doc
  9. Java反射 Class类
  10. pytorch学习笔记(十):MLP
  11. atitit.基于bat cli的插件管理系统.doc
  12. 使用Excel功能抓取网页表格数据
  13. LaTeX符号大全-基于lshort-zh-cn
  14. android多屏幕共享,一种实现多人屏幕无线共享的方法技术
  15. 两圆的外切线与内切线的切点算法
  16. SpringBoot自动化配置原理
  17. python系统编程培训
  18. Linux服务器通过X11实现图像化界面显示
  19. 超时用集群脚本ync.sh、xcall.sh
  20. 双路微型计算机,十二核心至尊 Intel Xeon E5-2697 v2

热门文章

  1. iOS之 simlator模拟器截屏
  2. 主梁弹性模量计算_轮扣模板计算书(GB51210-2016规范)
  3. java:换行符“\n”
  4. MQ消息队列的12点核心原理总结
  5. PHP的消息队列详解
  6. Spring学习04:事务控制(TransactionManager)
  7. Camera电路、图像传感器问题汇总
  8. Java设计模式超详细
  9. 常用元器件使用方法5:RS-232电平转换芯片SP3232EEN的使用方法
  10. Axure模板库(1)-常见网站