文章目录

  • 1、DataFrame的方法使用举例
  • 2、DataFrame的方法调用通用方式
  • 3、DataFrame直接调用其它方法
  • 本系列教程教程完整目录:

前面已经提到,Pandas的DataFrame本质上其实就是一个表。对应Excel,我们通常会用到各种统计方法。那么这篇教程就简单叙述一下Pandas中基本的统计方法以及通用的调用规则。

1、DataFrame的方法使用举例

DataFrame中封装了许多方便查看的方法,比如:

  • 查看首尾
df.head()月份  姓名 性别  应发工资   实发工资  职位
0   1  张三  男  2000   1500  主犯
1   2  张三  男  None   1000  主犯
2   3  张三  女  2000  15000  主犯
3   4  张三  女  2000   1500  主犯
4   5  张三  女  2000   1500  主犯df.tail()月份  姓名 性别  应发工资  实发工资  职位
8    5  李四  男  1800  1300  从犯
9    1  王五  女  1800  1300  龙套
10   2  王五  女  1800  1300  龙套
11   3  王五  女  1800  1300  龙套
12   4  王五  女  1800  1300  龙套

当然还可以在方法中输入数字,表示查看前几行和后几行。

2、DataFrame的方法调用通用方式

从上面的例子可以看到,DataFrame在调用方法时就是在最后加入.+方法名即可。另外也注意到,这种方式返回的类型仍然是一个DataFrame。事实上在调用这些方法时,这些方法的作用域通常是对每一列进行作用,比如:

df.max()月份          5
姓名         王五
性别          男
应发工资     2000
实发工资    15000
职位         龙套
dtype: objectdf.min()月份         1
姓名        张三
性别         女
应发工资    1800
实发工资    1000
职位        主犯
dtype: object

结合原表,很容易看到实际上返回的值是对每一例取最大或者最小再返回的。而此时返回的值是一个Series,原来的表头变成了Index

那么对应的,我们其实也可以猜到一些用法,比如求平均、中位数等等:

df.mean()月份         3.000000
应发工资    1866.666667
实发工资    2376.923077
dtype: float64df.median()月份         3.0
应发工资    1800.0
实发工资    1300.0
dtype: float64

并且有意思的是,这些方法会自动选择可以进行操作的列。比如这里就只返回了数值列的平均和中位数。

类似的方法还有很多,这里就不一一列举,具体使用时可以参考:Pandas中DataFrame的属性及方法大全

3、DataFrame直接调用其它方法

这里再重点介绍一个方法apply,该方法是将函数直接传入DataFrame并沿指定的方向进行计算,比如

df.apply(np.max)月份          5
姓名         王五
性别          男
应发工资     2000
实发工资    15000
职位         龙套
dtype: object

这里默认是按列操作,如果要换成按行操作则可以设置参数axis=1

不过对这们这组数据,直接按行操作会出现样的问题:

df.apply(np.max,axis=1)
---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-186-956304eff83f> in <module>
----> 1 df.apply(np.max,axis=1)TypeError: '>=' not supported between instances of 'int' and 'str'

错误说大于等于比较不能作用于整数和字符串。所以在使用时要注意事先检查该函数是否能应用于想作用的区域。

本系列教程教程完整目录:

一、Pandas简介与安装

二、Pandas基本数据结构-DataFrame与Series

三、Pandas文件读写

四、Pandas数据索引方式

五、Pandas简单统计操作及通用方式

六、Pandas条件查询

七、Pandas缺失数据的处理(数据清洗基础)

八、Pandas数据透视表

九、表的合并、连接、拼接(数据聚合基础)

Pandas简明教程:五、Pandas简单统计操作及通用方式相关推荐

  1. Pandas简明教程:九、表的合并、连接、拼接(数据聚合基础)

    真实场景中常会遇到多种信息放在不同的表里的情况,此时我们就需要将这些表格的信息整合到一起.这种操作可以极大地减轻我们手动粘数据的工作,从而达到事半功倍的效果. 由于本篇要举的例子较多,因此直接采用官网 ...

  2. Pandas简明教程:八、Pandas数据透视表

    透视表(pivot)是由微软发明的一个概念,1993年微软注册了PivotTable这一商标,而他们又在2020年正式撤销了注册. 关于透视表的话题随便搜搜就是一大堆,而有些地方可能都吹得很神了.透视 ...

  3. Pandas简明教程-适用于竞赛、研究以及办公自动化

    数据的读.写.查.改是数据分析的基础,也是竞赛.研究以及办公自动化类项目的常用操作.为了让大家能以更简单的方法来操作数据,我们选择Pandas作为处理数据的工具,希望通过这个系列的教程能够帮助大家节省 ...

  4. Pandas简明教程:七、Pandas缺失数据的处理(数据清洗基础)

    文章目录 1.缺失数据的类型 2.定位缺失数据 3.修改定位数据 4.批量修改缺失数据 5.数据修复的利器--插值法(`interpolate`) 本系列教程教程完整目录: 数据清洗的内容其实很丰富, ...

  5. Pandas简明教程:六、Pandas条件查询

    文章目录 1.基本方法 2.高级查询 3. 可用于修改内容的`where`方法 4.条件检索进阶:快速的查询方法`query` 5.其它检索方法简述 本系列教程教程完整目录: 目前大家公认的一个说法是 ...

  6. Pandas简明教程:三、Pandas文件读写

    文章目录 1.CSV文件 2.Excel的读写 3.HTML文件的读写 4.其它文件(数据)类型的简单说明 5.办公自动化问题简析 本系列教程教程完整目录: Pandas支持了非常丰富的文件类型(见文 ...

  7. Pandas简明教程:四、Pandas数据索引方式

    文章目录 1.以类似`dict`的方式访问 2.以属性方式访问数据 3.访问行(slicing) 4.用`loc`方法访问不同行列 5.用`iloc`方法直接访问行列 6.其它方式 本系列教程教程完整 ...

  8. Pandas简明教程:二、Pandas基本数据结构-DataFrame与Series

    文章目录 1.什么是表格? 2.DataFrame类型 3.Series类型 本系列教程教程完整目录: 1.什么是表格? 月份 姓名 性别 应发工资 实发工资 职位 0 1 张三 男 2000 150 ...

  9. Pandas简明教程:一、Pandas简介与安装

    文章目录 1.Pandas简介 2.为何要用Pandas? 3.知识.技能与环境的准备 4.Pandas的安装与相关辅助资料 本系列教程教程完整目录: 1.Pandas简介 关于Pandas的介绍在百 ...

最新文章

  1. python打印空心平行四边形的面积公式_打印等腰三角形和空心平行四边形
  2. 实用ExtJS教程100例-006:ExtJS中Window的用法示例
  3. 编译原理实验报告_任意给定一个正规式 r (包括连接、或、闭包运算),根据 Thompson算法设计一个程序,生成与该正规式等价的 NFA N 。
  4. Pytorch(八) --Pytorch实现多分类问题
  5. tensor也可以作为索引
  6. 机器学习十大经典算法之KNN最近邻算法
  7. 数字逻辑之组合逻辑电路
  8. python学习笔记六 初识面向对象上(基础篇)
  9. iOS---UICollectlionView 的使用
  10. delphi IOS 通知 TNotification
  11. 编译Windows版本ffmpeg:MingW方式失败
  12. idea怎么集成svn服务端,使用Mac自带svn搭建服务器,并使用idea进行连接(示例代码)...
  13. 【人工智能】机器学习西瓜书11——经验误差与过拟合,模型评估的方法,均方误差,错误率与精度,最优阈值
  14. Maven打包 错误: 程序包org.junit不存在
  15. Redis | 哨兵模式-Sentinel
  16. Excel如何批量删除工作表全部图片?
  17. Benchmarking Lane-changing Decision-making for Deep Reinforcement Learning
  18. LaTeX 使用心得:节标题(section)中使用数学符号
  19. 【每日一道智力题】之 药瓶毒鼠鼠
  20. 如何使用 vimdiff 来 git diff

热门文章

  1. dataimagepng php_php用header('content-type: image/png')输出验证码,但响应回来的是text/html...
  2. jrebel热部署不起作用_5种SpringBoot热部署方式,你用哪种?
  3. 可持久化线段树——主席树
  4. 自顶向下彻底理解 Java 中的 Synchronized
  5. java 基础--NIO(4)
  6. 如何垂直居中一个浮动元素
  7. 这是一个测试rss的内容哦
  8. jquery实现加载更多效果
  9. To-do List
  10. 某中国500强企业BI系统成功应用案例