python 分位数计算代码_Python数据分析第十一节 数据运算
数据运算不仅仅是加减乘除的基本运算,还要包括数据的比较,汇总和相关性的计算等等,这一节我们将计算的问题帮大家汇总出来~
目录
一. 加减乘除运算
二. 比较运算
三. 汇总运算
count 非空值计数
sum 求和
其他(均值,最大最小值,中位数,众数,方差,标准差,分位数)
四. 相关性运算
一. 加减乘除运算
以下表为例:
加法运算
我们需要生成新的一列“总和”,将四个季度的销售额相加:
df['总和'] 表示生成新的一列,列名为“总和”
减法运算
我们看一下第二季度和第一季度销售额的差额,用第二季度减第一季度:
乘法和除法的计算格式也是一样的,这里就不在具体举例说明。
二. 比较运算
这里介绍的比较,是指对比表格的两列大小之间的关系,输出的值为True 或者False,跟Excel中用IF 函数进行对比效果是一样的。
举例:比较是否第二季度销售额大于等于第一季度
常用对比语句:
# 第一季度大于第二季度df['第一季度']>df['第二季度']# 第一季度不等于第二季度df['第一季度']!=df['第二季度']# 第一季度小于等于第二季度df['第一季度']<=df['第二季度']
三. 汇总计算
1. count 非空值计数
在python 中直接调用count()函数,返回的结果为该数据表中每列非空值的个数。具体实现如下所示:
上面是查看每一列非空值的个数,如果想要查看每一行的非空值个数又该怎么办呢?其实count()方法默认参数是axis=0,即查看每一列。查看每行只需要输入参数axis=1 即可:
当然,我们也可以查看具体某一列的非空值个数,比如我们想看一下第一季度这一列的非空值个数:
2. sum 求和
在python中,直接在整个数据表上调用sum()函数,返回的是该数据表每一列的求和结果,例子如下所示:
如果想对每一行进行求和,则需要在sum后面括号中输入axis=1即可。
当然只对某一列求和也是可以的,比如对第一季度求和,代码如下:
df['第一季度'].sum()
3. 其他
# 求均值df.mean()# 求最大值df.max()# 求最小值df.min()# 求中位数df.median()# 求众数df.mode()# 求方差df.var()# 求标准差df.std()# 求分位数# 1.求1/4分位数df.quantile(0.25)# 2.求2/4分位数df.quantile(0.5)# 3.求3/4分位数df.quantile(0.75)
四. 相关性运算
相关性常用来衡量两个事物之间的相关程度,我们一般用相关系数来衡量两者的相关程度,所以相关性计算就是计算相关系数,比较常用的是皮尔逊相关系数。
在python中求相关系数用的是corr()方法,例子如下:
上面算出的是第一季度销售额和总销售额的相关性系数
我们还可以利用corr()函数算出两两之间的相关性,示例如下:
这样就生成了相关性系数的矩阵图!
?
长按关注公众号
欢迎留言交流
python 分位数计算代码_Python数据分析第十一节 数据运算相关推荐
- python科学计算三剑客_Python数据分析 三剑客篇(一)NumPy
Python数据分析(一)Numpy NumPy,Pandas和 Matplotlib "工欲善其事,必先利其器." Numpy ,pandas 和 Matplotlib 被称为P ...
- python计算人口增长率_Python数据分析之全球人口数据
这篇文章用pandas对全球的人口数据做个简单分析.我收集全球各国1960-2019年人口数据,包含男女和不同年龄段,共6个文件. pop_total.csv: 各国每年总人口 pop_female. ...
- python人口数字预测_Python数据分析之全球人口数据
这篇文章用pandas对全球的人口数据做个简单分析.我收集全球各国1960-2019年人口数据,包含男女和不同年龄段,共6个文件. pop_total.csv: 各国每年总人口 pop_female. ...
- 第四章第十一节数据资产盘点-设计数据资产标签
第四章第十一节数据资产盘点-设计数据资产标签 在形成数据资产目录以后,开始设计数据资产标签体系,例如对于一个字段"客户名称"来说,需要给这个客户名称打上一个标签,比安全等级是几级? ...
- 基于python的旅游系统_Python数据分析 I 全国旅游景点分析案例,哪里好玩一目了然...
前言 文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者: 刘亦菲的老公 PS:如有需要Python学习资料的小伙伴可以加点击下 ...
- python怎么计算圆_python计算圆心
广告关闭 腾讯云11.11云上盛惠 ,精选热门产品助力上云,云服务器首年88元起,买的越多返的越多,最高返5000元! 导语:这几天,小编学习到了一个好玩的摄像头图像圆心计算的程序代码. 另外,小编t ...
- python科学计算三剑客_1-python数据分析-数据分析介绍、数据分析三剑客之NumPy
数据分析三剑客 numpy pandas(重点) matplotlib numpy模块 NumPy(Numerical Python) 是 Python 语言中做科学计算的基础库.侧重在于数值计算,也 ...
- python pd Series 添加行_Python数据分析与挖掘的常用工具
Python语言:简要概括一下Python语言在数据分析.挖掘场景中常用特性: 列表(可以被修改),元组(不可以被修改) 字典(结构) 集合(同数学概念上的集合) 函数式编程(主要由lambda(). ...
- python 加快计算速度_python怎么提高计算速度
下面是python中的一个函数计算代码: loops=25000000 from math import* a=range(1,loops) def f(x): return 3*cos(x)+4*s ...
最新文章
- js监听audio播放完毕
- mysql算法函数_mysql中的函数总结
- 初入react-redux (基于webpack babel的react应用框架)
- Aux函数java,verse.aux
- wordpress content.php,2020主题:content.php
- 问题之JVM_Bind
- 当我真正开始爱自己——查理·卓别林
- Kubernetes天生对多云策略的支持
- Winsock编程补遗
- tpcc-mysql安装测试与使用生成对比图
- linux下的终端利器----tmux
- Atitit cio之道 attilax著 2. CIO是企业组织很重要的一个官员,未来就靠信息取胜了	1 3. Cio职责	2 3.1. 企业信息化 对信息技术的利用来实现组织攻略目标	2 3
- f分布表完整图a=0.01_SQL数据库完整性
- cesium中实现热力图
- spring中的aop的xml配置方式简单实例
- 解决tensorboard无法访问此网站
- TIMG二进制文件转JPEG图片的方法
- [牛客网中级项目]第四章用户注册登陆管理
- 电子邮件附件下载器简介
- 技校考计算机专业大专考什么科目,高职专科考试科目有哪些 考什么内容