利用python进行数据分析论文_利用Python进行数据分析之pandas的高级用法

pandas

前面我们学习了pandas两种基本的数据结构Series和DataFrame以及基本功能，这节我们学习一下其他的略高级用法。

汇总和计算描述统计

df.sum(axis=1)

#求和，全为NaN才会NaN

df.mean(axis=1,skipna=False)

#平均数，有NaN结果就为NaN

这种约简方法的选项:

选项

说明

axis

约简的轴。DataFrame的行用0，列用1

skipna

排除缺失值，默认值为True

level

如果轴是层次化索引的(即Multilndex),则根据level分组约简

汇总统计idxmin和idxmax：

out：

one two

a 1.40 NaN

b 7.10 -4.5

c NaN NaN

d 0.75 -1.3

df.idxmax()

out:

one b

two d

df.cumsum()

out：

one two

a 1.40 NaN

b 8.50 -4.5

c NaN NaN

d 9.25 -5.8

还有descripe 它是多个汇总统计：

df.describe()

out:

one two

count 3.000000 2.000000

mean 3.083333 -2.900000

std 3.493685 2.262742

min 0.750000 -4.500000

25% 1.075000 -3.700000

50% 1.400000 -2.900000

75% 4.250000 -2.100000

max 7.100000 -1.300000

obj = Series(['a', 'a', 'b', 'c']* 4)

obj.describe()

out:

count 16

unique 3

top a

freq 8

分别说明如下：

方法

说明

count

非NA值的数量

describe

针对Series或各DataFrame列计算汇总统计

min, max

计算最小值和最大值

argmin, argmax

计算能够获取到最小值和最大值的索引位置(整数)

idxmin, idxmax

计算能够获取到最小值和最大值的索引值

quantile

计算样本的分位数(0到1)

sum

值的总和

mean

值的平均数

median

值的算术中位数(50%分位数)

mad

根据平均值计算平均绝对离差

var

样本值的方差

std

样本值的标准差

skew

样本值的偏度(三阶矩)

kurt

样本值的峰度(四阶矩)

cumsum

样本值的累计和

cummin. cummax

样本值的累计最大值和累计最小值

cumprod

样本值的累计积

diff

计算一阶差分《对时间序列很有用)

pct_change

计算百分数变化

利用python进行数据分析论文_利用Python进行数据分析之pandas的高级用法相关推荐

python天气数据分析论文_《Python数据分析与机器学习实战-唐宇迪》读书笔记第9章--随机森林项目实战——气温预测(2/2)...
第9章--随机森林项目实战--气温预测(2/2) 第8章已经讲解过随机森林的基本原理,本章将从实战的角度出发,借助Python工具包完成气温预测任务,其中涉及多个模块,主要包含随机森林建模.特征选择. ...
python天气数据分析论文_关于Python爬取天气数据的实例详解内容
importcsvimportsysimporturllib.requestfrom bs4 import BeautifulSoup #解析页面模块 importpygalimportcityinf ...
python房价分析论文_用Python研究了三千套房子，告诉你究竟是什么抬高了房价？...
关于房价,一直都是全民热议的话题,毕竟不少人终其一生都在为之奋斗. 房地产的泡沫究竟有多大不得而知?今天我们抛开泡沫,回归房屋最本质的内容,来分析一下房价的影响因素究竟是什么? 1.导入数据 impo ...
基于python的小论文_基于Python的网上论坛的实现
摘要随着科学技术与计算机网络应用的发展,人们的生活与工作越来越智能化,简洁化,网络化.也就可以腾出更多的时间用来思考周围的事情的合理化与有效话,人们也就更加的想要追求事物的公平公正.在相互讨论与理解的 ...
有关python方面的论文_有关python基础知识的文章推荐5篇
一.变量命名规则1.变量名只能是字母.数字.下划线的任意组合2.变量名不能以数字开头3.一些保留字段不能作为自定义变量名4变量名需要有明确含义,如保存名字的变量,最好定义为name之类的变量名二.字符 ...
python课程报告论文_高中Python校本课程的设计与实施
43 MAY 2019 NO.10 高中Python校本课程的设计与实施郑兴航江苏省锡山高级中学 2018年1月 , 新版高中信息技术课程标准正式颁布 , 对照2003版, 新标准在课程目标和 ...
8盏流水灯反向闪烁c语言,课程设计(论文)_利用8255A芯片实现流水灯闪烁设计.doc...
课程设计(论文)_利用8255A芯片实现流水灯闪烁设计利用8255A芯片实现流水灯闪烁设计 27 - 目录摘要··········································· ...
利用python进行数据分析数据_利用Python进行数据分析
1.注释以及在Subplot上绘图除标准的图表对象之外,你可能还希望绘制一些自定义的注释(比如文本.箭头或其他图形等). 注释可以通过text.arrow和annotate等函数进行添加.text可 ...
python统计行号_利用Python进行数据分析(第三篇上)
上一篇文章我记录了自己在入门 Python 学习的一些基础内容以及实际操作代码时所碰到的一些问题. 这篇我将会记录我在学习和运用 Python 进行数据分析的过程: 介绍 Numpy 和 Pandas ...

利用python进行数据分析论文_利用Python进行数据分析之pandas的高级用法

利用python进行数据分析论文_利用Python进行数据分析之pandas的高级用法相关推荐

最新文章

热门文章