1. 数值计算
df = pd.DataFrame({'key1':[4,5,3,np.nan,2],'key2':[1,2,np.nan,4,5],'key3':[1,2,3,'j','k']},index = ['a','b','c','d','e'])
print(df)
   key1  key2 key3
a   4.0   1.0    1
b   5.0   2.0    2
c   3.0   NaN    3
d   NaN   4.0    j
e   2.0   5.0    k
float64 float64 object

1.1 均值

  • 均值 df.mean() 整个DataFrame的均值,默认NaN值不参与运算
key1    3.5
key2    3.0
dtype: float64
  • 按行求均值axis=1
    m2 = df.mean(axis=1)
a    2.5
b    3.5
c    3.0
d    4.0
e    3.5
dtype: float64
  • 按列求均值axis=0,或通过列名
df['key2'].mean()  #3.0

1.2 分位数
pandas 分位数

1.3 一些其他函数

df.count(),→ count统计非Na值的数量
df.min(),→ min统计最小值
df['key2'].max()→ max统计最大值
df.sum()→ sum求和
df.mean()→ mean求平均值
df.median()→ median求算数中位数,50%分位数
df.std(),df.var()→ std,var分别求标准差,方差
df.skew()→ skew样本的偏度
df.kurt()→ kurt样本的峰度
df['key1_s'] = df['key1'].cumsum() # 计算累加和
df['key1_p'] = df['key1'].cumprod() #计算累积
df.cummax(),df.cummin() → cummax,cummin分别求累计最大值,累计最小值

1.4 唯一值:.unique() 相当于python中的set().

s = pd.Series(list('asdvasdcfgg'))
['a' 's' 'd' 'v' 'c' 'f' 'g'] <class 'numpy.ndarray'>

1.5 值计数:.value_counts() Series对象的性质,不能用于DataFrame

sc = s.value_counts(sort = False)# # 也可以这样写:pd.value_counts(sc, sort = False)
d    2
a    2
s    2
c    1
f    1
g    2
v    1
dtype: int64

1.6 成员资格:.isin()逐个元素判断,是否在xx中

df = pd.DataFrame({'key1':list('asdcbvasd'),'key2':np.arange(4,13)})
 key1  key2
0    a     4
1    s     5
2    d     6
3    c     7
4    b     8
5    v     9
6    a    10
7    s    11
8    d    12
print(df.isin(['a','bc','10',8]))
 key1   key2
0   True  False
1  False  False
2  False  False
3  False  False
4  False   True
5  False  False
6   True  False
7  False  False
8  False  False

pandas(四) -- 数值计算相关推荐

  1. pandas之数值计算与统计

    数值计算与统计 对于DataFrame来说,求和.最大.最小.平均等统计方法,默认是按列进行统计,即axis = 0,如果添加参数axis = 1则会按照行进行统计. 如果存在空值,在统计时默认会忽略 ...

  2. Python 之 Pandas (四)处理丢失数据

    代码: import numpy as np import pandas as pddates = pd.date_range('20130101', periods=6) df = pd.DataF ...

  3. 数据分析之python数据计算方法汇总(math|numpy|pandas)

    数据分析之python数据计算方法上篇(math|numpy)_Backup and share的博客-CSDN博客 本文重点介绍pandas,math和numpy参见上篇> 目录 一.简介与创 ...

  4. Python数据分析之pandas库的使用详解

    本篇文章所依据是蚂蚁学Python作者讲解所写,且已征求作者的同意,内容基本都是视频中所讲的内容.视频满满的全是干货,也可一边看视频一边配合着本篇文章. 作者的公众号:蚂蚁学Python 作者也提供了 ...

  5. matplotlib plot 分组_小白学 Python 数据分析(16):Matplotlib(一)坐标系

    人生苦短,我用 Python 前文传送门: 小白学 Python 数据分析(1):数据分析基础 小白学 Python 数据分析(2):Pandas (一)概述 小白学 Python 数据分析(3):P ...

  6. 去除dataframe中的空行_Python数据分析中的处理与数值加速技巧简介

    微信公众号:cha-diary 大家好! 在这一段时间呢,我主要针对自己调研的一个机器学习模型进行了复现.俗话说得好,读论文一时爽,到复现火葬场.我可能现在后悔就后悔在习惯了Py的解释型环境,把C的那 ...

  7. 关于Python在Linux、Mac和Windows上的安装方法总结

    一.Linux下安装python 1.python源码安装包下载地址: https://www.python.org/downloads/source/ 2.下载完tar.xz压缩包以后,开始解压: ...

  8. python爬虫之云片网国内短信接口爬取

    安装requests,lxml,openpyxl,pandas四个包. requests爬取 lxml解析 panda转换并保存 openpyxl是读写excel文件所用到的包 代码奉上: impor ...

  9. 【Python】06 - 常用文件处理(txt、excel [xlsx、xls])

    目录 一.文件概述 二.文本文件操作 2.1 文件打开 2.2 文件的关闭 2.3 文件的读.写操作 1) 读取方法 2)写入方法 2.4 读写指针的重定位 2.5 其它文本文件 三.Excel文件处 ...

最新文章

  1. 图片管理之删除SKU表数据
  2. 码code | 巧用2种方法,打破20条云开发数据库限制
  3. asp.mvc 4项目发布文件目录结构_Spring Boot项目搭建与启动
  4. Cloud一分钟 | 14万中国人基因大数据是否外泄?运营商发展大数据优势何在?
  5. 事件CEvent的使用
  6. leetcode 179 python
  7. 洛谷 P2167 [SDOI2009]Bill的挑战
  8. php 编译记录文件,php-7.1编译记录
  9. 用C语言编写爱心代码
  10. 电子报纸的分析即制作
  11. C语言:文章各类字符数统计
  12. php 邮箱反垃圾机制,企业邮箱中的反垃圾邮件规则
  13. 忘记了PDF文件密码,找回密码
  14. 【毕业设计】基于大数据的招聘与租房分析可视化系统
  15. sorry, unimplemented: non-trivial designated initializers not supported
  16. 不到3000块钱,如何支撑起每月500万次访问量及80TB流量的网站?
  17. 随机模型,估计与控制 ——介绍
  18. 为什么电子邮件发送失败?电子邮件发送失败的原因及解决方法
  19. 接上篇,记录一下【Unity 3D对博途PLCSIM的通讯】文章有点长~仔细看,很基础
  20. 倍思和绿联扩展坞哪个好_Macbook用什么扩展坞好?贝尔金对比绿联,国产更胜一筹...

热门文章

  1. shtml与php的区别,htm,html.shtml区别
  2. 数学之路(2)-数据分析-R基础(1)
  3. 程序员的4种心态与4种将来
  4. PyTorch随笔-0
  5. tensorflow随笔-队列(1)
  6. C指针原理(21)-C指针基础-ATT汇编
  7. 【建议收藏】数学建模竞赛网站汇总
  8. 推荐我记视频课程笔记的方法和几个工具
  9. 机器学习小抄-(像背托福单词一样理解机器学习)
  10. 别魔改网络了,Google研究员:模型精度不高,是因为你的Resize方法不够好