1.pandas基本函数

2.pandas 描述统计函数

在进行统计描述时,pandas对三个数据对象的轴参数规定如下:

Series: 没有轴参数

DataFrame: “index” (axis=0, default), “columns” (axis=1)

Panel: “items” (axis=0), “major” (axis=1, default), “minor” (axis=2)

统计描述参数如下:

3.pandas 数据框增、删、改、查、去重、抽样基本操作

pandas的索引函数主要有三种:

loc 标签索引,行和列的名称

iloc 整型索引(绝对位置索引),绝对意义上的几行几列,起始索引为0

ix 是 iloc 和 loc的合体

(1)行操作

选择某一行

选择多行

条件筛选

普通条件筛选

另外条件筛选还可以集逻辑运算符 | for or, & for and, and ~for not

isin

非索引列使用isin

索引列使用isin

结合any()/all()在多列索引时

where

DataFrame.where() differs from numpy.where()的区别

当series对象使用where()时,则返回一个序列

抽样筛选

DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)

当在有权重筛选时,未赋值的列权重为0,如果权重和不为1,则将会将每个权重除以总和。random_state可以设置抽样的种子(seed)。axis可是设置列随机抽样。

增加行

插入行

pandas里并没有直接指定索引的插入行的方法,所以要自己设置

line = pd.DataFrame({df.columns[0]:"--",df.columns[1]:"--",df.columns[2]:"--"},index=[1])

df = pd.concat([df.loc[:0],line,df.loc[1:]]).reset_index(drop=True)#df.loc[:0]这里不能写成df.loc[0],因为df.loc[0]返回的是series

a b c

0 1.0 a A

1 -- -- --

2 2.0 b B

3 3.0 c C

4 4.0 4 4

交换行

删除行

注意在以时间作为索引的数据框中,索引是以整形的方式来的。

dfl = pd.DataFrame(np.random.randn(5,4), columns=list('ABCD'), index=pd.date_range('20130101',periods=5))

print df1

(2)列操作

选择某一列

选择多列

增加列,如果是已有列,那就是赋值

交换两列的值

删除列

1)直接del DF[‘column-name’]

2)采用drop方法,有下面三种等价的表达式:

DF= DF.drop(‘column_name’, 1);

DF.drop(‘column_name’,axis=1, inplace=True)

DF.drop([DF.columns[[0,1,]]], axis=1,inplace=True)

还有一些其他的功能:

切片df.loc[::,::]

选择随机抽样df.sample()

去重.duplicated()

查询.lookup

pandas 索引去重_pandas(一)相关推荐

  1. pandas 索引去重_Pandas 同元素多列去重的实例

    Pandas 同元素多列去重的实例 有一些问题可能会遇到同元素多列去重问题,下面介绍一种非常简单效率也很快的做法,用pandas来实现. 首先我们看一下数据类型: G1 G2 a b b a c d ...

  2. pandas 索引去重_python中pandas.DataFrame的简单操作方法(创建、索引、增添与删除) 如何更新pandas dataframe的值...

    我用Python做了一个樱花树,360说有活动感染病毒正...import random import turtle __Pen = turtle.Pen() # 分形樱花树 # "画你的e ...

  3. pandas索引复合索引dataframe数据、索引其中一个水平(level)的所有数据行(index all rows in a level)

    pandas索引复合索引dataframe数据.索引其中一个水平(level)的所有数据行(index all rows in a level) 目录

  4. pandas索引复合索引dataframe数据、索引dataframe中指定行和指定列交叉格子的数据内容(getting a specific value)、使用元组tuple表达复合索引的指定行

    pandas索引复合索引dataframe数据.索引dataframe中指定行和指定列交叉格子的数据内容(getting a specific value).使用元组tuple表达复合索引的指定行 目 ...

  5. pandas索引复合索引dataframe数据、索引其中一个水平(level)的所特定数据行、指定数据行(index a row of a level)、使用元组tuple表达复合索引的指定行

    pandas索引复合索引dataframe数据.索引其中一个水平(level)的所特定数据行.指定数据行(index a row of a level).使用元组tuple表达复合索引的指定行 目录

  6. pandas索引复合索引dataframe数据、索引其中多个水平(level)的多个数据行(index rows from different levels)、使用元组tuple表达复合索引的指定行

    pandas索引复合索引dataframe数据.索引其中多个水平(level)的多个数据行(index rows from different levels and combine).使用元组tupl ...

  7. pandas索引复合索引dataframe数据、索引其中一个水平(level)的特定数据列(index a column of a level)

    pandas索引复合索引dataframe数据.索引其中一个水平(level)的特定数据列(index a column of a level) 目录

  8. pandas索引和选择数据

    使用pandas索引和选择数据时,总是需要百度,因此决定对pandas.DataFrame中的索引和选择方法做个总结.所用的pandas版本号为0.20.1 pandas中有三种索引方法:.loc,. ...

  9. mongodb 索引去重_PostgreSQL13新特性解读Btree索引去重Deduplication

    背景 PostgreSQL13.0于2020年9月24日正式release,13版本的PG带来很多优秀特性:比如索引的并行vacuum,增量排序,btree索引deduplication,异构分区表逻 ...

  10. python分组求和_Python学习笔记之pandas索引列、过滤、分组、求和功能示例

    本文实例讲述了Python学习笔记之pandas索引列.过滤.分组.求和功能.分享给大家供大家参考,具体如下: 前面我们已经把519961(基金编码)这种基金的历史净值明细表html内容抓取到了本地, ...

最新文章

  1. nuxt 如何引入js_nuxtjs如何在单独的js文件中引入store和router
  2. java 树 右键菜单_VUE实现Studio管理后台(八):用右键菜单contextmenu,编辑树形结构...
  3. 图方法:二分无向图的联通子图查找
  4. brew 无法安装iterm2_Mac安装sshpass 替代spawn自动登录脚本(解决rz sz问题)
  5. ConnectionRead (WrapperRead())Timeout expired
  6. Java对MySql数据库进行备份与还原
  7. 欠的债,这一次都还给你们
  8. 【金万维】天联高级版的管理员帐号和密码忘记
  9. 软件测评师考试大纲2018
  10. 镁光ssd管理工具 linux,解决BIOS找不到SSD,镁光SSD固态硬盘升级固件方法
  11. AIGC席卷,抖快、阅文、知乎大战网文圈
  12. 华为nova8计算机功能在,华为nova8隐藏功能怎么开启(华为nova8的隐藏功能)
  13. iOS Password AutoFill开发指南
  14. java常见的hash算法_常见的哈希算法和用途
  15. Pandas 统计分析基础 笔记2 任务4.2 掌握DataFrame的常用操作
  16. python中,@和- 代表什么?
  17. 二手房买卖中“跳单”行为之探讨
  18. 初学python选择哪个软件_初学 Python 需要安装哪些软件?
  19. APScheduler Multi CronTrigger 实现
  20. 今天睡眠质量记录较差

热门文章

  1. [mysql终极优化]之主从复制与读写分离详细设置教程
  2. 项目设计之----命令模式的利用
  3. CKeditor与CKfinder的简单配置
  4. Java对证书的操作
  5. perl--CGI编程之Apache服务器安装配置
  6. exists/not exists(2020-3-27)
  7. Linux 找不到qt,linux – CMake找不到QtCore
  8. 360兼容模式页面错位_如何处理网站兼容性
  9. 计算机机房维护与管理,计算机机房的管理与维护.doc
  10. wince植入胎压监测_wince设备通过USB连接线上网指南(原创)(测试成功)