pandas(四) -- 数值计算
- 数值计算
df = pd.DataFrame({'key1':[4,5,3,np.nan,2],'key2':[1,2,np.nan,4,5],'key3':[1,2,3,'j','k']},index = ['a','b','c','d','e'])
print(df)
key1 key2 key3
a 4.0 1.0 1
b 5.0 2.0 2
c 3.0 NaN 3
d NaN 4.0 j
e 2.0 5.0 k
float64 float64 object
1.1 均值
- 均值
df.mean()
整个DataFrame的均值,默认NaN值不参与运算
key1 3.5
key2 3.0
dtype: float64
- 按行求均值
axis=1
m2 = df.mean(axis=1)
a 2.5
b 3.5
c 3.0
d 4.0
e 3.5
dtype: float64
- 按列求均值
axis=0
,或通过列名
df['key2'].mean() #3.0
1.2 分位数
pandas 分位数
1.3 一些其他函数
df.count(),→ count统计非Na值的数量
df.min(),→ min统计最小值
df['key2'].max()→ max统计最大值
df.sum()→ sum求和
df.mean()→ mean求平均值
df.median()→ median求算数中位数,50%分位数
df.std(),df.var()→ std,var分别求标准差,方差
df.skew()→ skew样本的偏度
df.kurt()→ kurt样本的峰度
df['key1_s'] = df['key1'].cumsum() # 计算累加和
df['key1_p'] = df['key1'].cumprod() #计算累积
df.cummax(),df.cummin() → cummax,cummin分别求累计最大值,累计最小值
1.4 唯一值:.unique()
相当于python中的set().
s = pd.Series(list('asdvasdcfgg'))
['a' 's' 'd' 'v' 'c' 'f' 'g'] <class 'numpy.ndarray'>
1.5 值计数:.value_counts()
Series对象的性质,不能用于DataFrame
sc = s.value_counts(sort = False)# # 也可以这样写:pd.value_counts(sc, sort = False)
d 2
a 2
s 2
c 1
f 1
g 2
v 1
dtype: int64
1.6 成员资格:.isin()
逐个元素判断,是否在xx中
df = pd.DataFrame({'key1':list('asdcbvasd'),'key2':np.arange(4,13)})
key1 key2
0 a 4
1 s 5
2 d 6
3 c 7
4 b 8
5 v 9
6 a 10
7 s 11
8 d 12
print(df.isin(['a','bc','10',8]))
key1 key2
0 True False
1 False False
2 False False
3 False False
4 False True
5 False False
6 True False
7 False False
8 False False
pandas(四) -- 数值计算相关推荐
- pandas之数值计算与统计
数值计算与统计 对于DataFrame来说,求和.最大.最小.平均等统计方法,默认是按列进行统计,即axis = 0,如果添加参数axis = 1则会按照行进行统计. 如果存在空值,在统计时默认会忽略 ...
- Python 之 Pandas (四)处理丢失数据
代码: import numpy as np import pandas as pddates = pd.date_range('20130101', periods=6) df = pd.DataF ...
- 数据分析之python数据计算方法汇总(math|numpy|pandas)
数据分析之python数据计算方法上篇(math|numpy)_Backup and share的博客-CSDN博客 本文重点介绍pandas,math和numpy参见上篇> 目录 一.简介与创 ...
- Python数据分析之pandas库的使用详解
本篇文章所依据是蚂蚁学Python作者讲解所写,且已征求作者的同意,内容基本都是视频中所讲的内容.视频满满的全是干货,也可一边看视频一边配合着本篇文章. 作者的公众号:蚂蚁学Python 作者也提供了 ...
- matplotlib plot 分组_小白学 Python 数据分析(16):Matplotlib(一)坐标系
人生苦短,我用 Python 前文传送门: 小白学 Python 数据分析(1):数据分析基础 小白学 Python 数据分析(2):Pandas (一)概述 小白学 Python 数据分析(3):P ...
- 去除dataframe中的空行_Python数据分析中的处理与数值加速技巧简介
微信公众号:cha-diary 大家好! 在这一段时间呢,我主要针对自己调研的一个机器学习模型进行了复现.俗话说得好,读论文一时爽,到复现火葬场.我可能现在后悔就后悔在习惯了Py的解释型环境,把C的那 ...
- 关于Python在Linux、Mac和Windows上的安装方法总结
一.Linux下安装python 1.python源码安装包下载地址: https://www.python.org/downloads/source/ 2.下载完tar.xz压缩包以后,开始解压: ...
- python爬虫之云片网国内短信接口爬取
安装requests,lxml,openpyxl,pandas四个包. requests爬取 lxml解析 panda转换并保存 openpyxl是读写excel文件所用到的包 代码奉上: impor ...
- 【Python】06 - 常用文件处理(txt、excel [xlsx、xls])
目录 一.文件概述 二.文本文件操作 2.1 文件打开 2.2 文件的关闭 2.3 文件的读.写操作 1) 读取方法 2)写入方法 2.4 读写指针的重定位 2.5 其它文本文件 三.Excel文件处 ...
最新文章
- 图片管理之删除SKU表数据
- 码code | 巧用2种方法,打破20条云开发数据库限制
- asp.mvc 4项目发布文件目录结构_Spring Boot项目搭建与启动
- Cloud一分钟 | 14万中国人基因大数据是否外泄?运营商发展大数据优势何在?
- 事件CEvent的使用
- leetcode 179 python
- 洛谷 P2167 [SDOI2009]Bill的挑战
- php 编译记录文件,php-7.1编译记录
- 用C语言编写爱心代码
- 电子报纸的分析即制作
- C语言:文章各类字符数统计
- php 邮箱反垃圾机制,企业邮箱中的反垃圾邮件规则
- 忘记了PDF文件密码,找回密码
- 【毕业设计】基于大数据的招聘与租房分析可视化系统
- sorry, unimplemented: non-trivial designated initializers not supported
- 不到3000块钱,如何支撑起每月500万次访问量及80TB流量的网站?
- 随机模型,估计与控制 ——介绍
- 为什么电子邮件发送失败?电子邮件发送失败的原因及解决方法
- 接上篇,记录一下【Unity 3D对博途PLCSIM的通讯】文章有点长~仔细看,很基础
- 倍思和绿联扩展坞哪个好_Macbook用什么扩展坞好?贝尔金对比绿联,国产更胜一筹...