数据运算不仅仅是加减乘除的基本运算,还要包括数据的比较,汇总和相关性的计算等等,这一节我们将计算的问题帮大家汇总出来~

目录

一. 加减乘除运算

二. 比较运算

三. 汇总运算

  1. count 非空值计数

  2. sum 求和

  3. 其他(均值,最大最小值,中位数,众数,方差,标准差,分位数)

四. 相关性运算

一. 加减乘除运算

以下表为例:

加法运算

我们需要生成新的一列“总和”,将四个季度的销售额相加:

df['总和'] 表示生成新的一列,列名为“总和”

减法运算

我们看一下第二季度和第一季度销售额的差额,用第二季度减第一季度:

乘法和除法的计算格式也是一样的,这里就不在具体举例说明。

二. 比较运算

这里介绍的比较,是指对比表格的两列大小之间的关系,输出的值为True 或者False,跟Excel中用IF 函数进行对比效果是一样的。

举例:比较是否第二季度销售额大于等于第一季度

常用对比语句:

# 第一季度大于第二季度df['第一季度']>df['第二季度']# 第一季度不等于第二季度df['第一季度']!=df['第二季度']# 第一季度小于等于第二季度df['第一季度']<=df['第二季度']

三. 汇总计算

1. count 非空值计数

在python 中直接调用count()函数,返回的结果为该数据表中每列非空值的个数。具体实现如下所示:

上面是查看每一列非空值的个数,如果想要查看每一行的非空值个数又该怎么办呢?其实count()方法默认参数是axis=0,即查看每一列。查看每行只需要输入参数axis=1 即可:

当然,我们也可以查看具体某一列的非空值个数,比如我们想看一下第一季度这一列的非空值个数:

2. sum 求和

在python中,直接在整个数据表上调用sum()函数,返回的是该数据表每一列的求和结果,例子如下所示:

如果想对每一行进行求和,则需要在sum后面括号中输入axis=1即可。

当然只对某一列求和也是可以的,比如对第一季度求和,代码如下:

df['第一季度'].sum()

3. 其他

# 求均值df.mean()# 求最大值df.max()# 求最小值df.min()# 求中位数df.median()# 求众数df.mode()# 求方差df.var()# 求标准差df.std()# 求分位数# 1.求1/4分位数df.quantile(0.25)# 2.求2/4分位数df.quantile(0.5)# 3.求3/4分位数df.quantile(0.75)

四. 相关性运算

相关性常用来衡量两个事物之间的相关程度,我们一般用相关系数来衡量两者的相关程度,所以相关性计算就是计算相关系数,比较常用的是皮尔逊相关系数。

在python中求相关系数用的是corr()方法,例子如下:

上面算出的是第一季度销售额和总销售额的相关性系数

我们还可以利用corr()函数算出两两之间的相关性,示例如下:

这样就生成了相关性系数的矩阵图!

?

长按关注公众号

欢迎留言交流

python 分位数计算代码_Python数据分析第十一节 数据运算相关推荐

  1. python科学计算三剑客_Python数据分析 三剑客篇(一)NumPy

    Python数据分析(一)Numpy NumPy,Pandas和 Matplotlib "工欲善其事,必先利其器." Numpy ,pandas 和 Matplotlib 被称为P ...

  2. python计算人口增长率_Python数据分析之全球人口数据

    这篇文章用pandas对全球的人口数据做个简单分析.我收集全球各国1960-2019年人口数据,包含男女和不同年龄段,共6个文件. pop_total.csv: 各国每年总人口 pop_female. ...

  3. python人口数字预测_Python数据分析之全球人口数据

    这篇文章用pandas对全球的人口数据做个简单分析.我收集全球各国1960-2019年人口数据,包含男女和不同年龄段,共6个文件. pop_total.csv: 各国每年总人口 pop_female. ...

  4. 第四章第十一节数据资产盘点-设计数据资产标签

    第四章第十一节数据资产盘点-设计数据资产标签 在形成数据资产目录以后,开始设计数据资产标签体系,例如对于一个字段"客户名称"来说,需要给这个客户名称打上一个标签,比安全等级是几级? ...

  5. 基于python的旅游系统_Python数据分析 I 全国旅游景点分析案例,哪里好玩一目了然...

    前言 文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者: 刘亦菲的老公 PS:如有需要Python学习资料的小伙伴可以加点击下 ...

  6. python怎么计算圆_python计算圆心

    广告关闭 腾讯云11.11云上盛惠 ,精选热门产品助力上云,云服务器首年88元起,买的越多返的越多,最高返5000元! 导语:这几天,小编学习到了一个好玩的摄像头图像圆心计算的程序代码. 另外,小编t ...

  7. python科学计算三剑客_1-python数据分析-数据分析介绍、数据分析三剑客之NumPy

    数据分析三剑客 numpy pandas(重点) matplotlib numpy模块 NumPy(Numerical Python) 是 Python 语言中做科学计算的基础库.侧重在于数值计算,也 ...

  8. python pd Series 添加行_Python数据分析与挖掘的常用工具

    Python语言:简要概括一下Python语言在数据分析.挖掘场景中常用特性: 列表(可以被修改),元组(不可以被修改) 字典(结构) 集合(同数学概念上的集合) 函数式编程(主要由lambda(). ...

  9. python 加快计算速度_python怎么提高计算速度

    下面是python中的一个函数计算代码: loops=25000000 from math import* a=range(1,loops) def f(x): return 3*cos(x)+4*s ...

最新文章

  1. js监听audio播放完毕
  2. mysql算法函数_mysql中的函数总结
  3. 初入react-redux (基于webpack babel的react应用框架)
  4. Aux函数java,verse.aux
  5. wordpress content.php,2020主题:content.php
  6. 问题之JVM_Bind
  7. 当我真正开始爱自己——查理·卓别林
  8. Kubernetes天生对多云策略的支持
  9. Winsock编程补遗
  10. tpcc-mysql安装测试与使用生成对比图
  11. linux下的终端利器----tmux
  12. Atitit cio之道 attilax著 2. CIO是企业组织很重要的一个官员,未来就靠信息取胜了 1 3. Cio职责 2 3.1. 企业信息化 对信息技术的利用来实现组织攻略目标 2 3
  13. f分布表完整图a=0.01_SQL数据库完整性
  14. cesium中实现热力图
  15. spring中的aop的xml配置方式简单实例
  16. 解决tensorboard无法访问此网站
  17. TIMG二进制文件转JPEG图片的方法
  18. [牛客网中级项目]第四章用户注册登陆管理
  19. 电子邮件附件下载器简介
  20. 技校考计算机专业大专考什么科目,高职专科考试科目有哪些 考什么内容

热门文章

  1. 基于nginx实现缓存功能及uptream模块详细使用方法
  2. Quartz 2D编程笔记
  3. PostgreSQL建表动作分析
  4. FireEye:2012年下半年高级威胁分析报告
  5. 同步本地远程分支 git remote prune origin
  6. 路由到另外一个页面_Nextjs使用解读一(项目搭建与路由系统)
  7. 机器学习接口和代码之 线性回归
  8. elementui table某一列是否显示_Vue项目引进ElementUI组件的方法
  9. Django中celery配置总结
  10. 曲线连接线_荷重位移曲线仪操作使用注意事项-荷重位移曲线仪厂家