python--pandas 分位数
搞懂箱形图分析,快速识别异常值!
- pandas 分位数
df.quantile(q=0.75)
计算分位数:pos=1+(n−1)∗qpos = 1+(n-1)*qpos=1+(n−1)∗q
pos=integer+float(整数部分+小数部分)pos = integer + float(整数部分 + 小数部分)pos=integer+float(整数部分+小数部分)
ans = df[integer-1] + float * (df[integer] - df[integer - 1])
举个例子:
定义一个DataFrame
df = pd.DataFrame({'key1':np.arange(0,6),'key2':np.arange(6,12)})
print(df)
key1 key2
0 0 6
1 1 7
2 2 8
3 3 9
4 4 10
5 5 11
- 通过函数直接求出结果
df.quantile(q=0.75)
key1 3.75
key2 9.75
Name: 0.75, dtype: float64
- 通过给出的公式求:
import math
q = 0.75
pos = 1 + (len(df) - 1) * q
ret,integer = math.modf(pos)#求出分位的小数部分和整数部分
print('整数部分是%f,小数部分是%f'%(integer,ret))
ans = df['key1'][int(integer)-1] + ret * (df['key1'][int(integer)] - df['key1'][int(integer)-1])
print('key1 ',ans)
ans2 = df['key2'][int(integer)-1] + ret * (df['key2'][int(integer)] - df['key2'][int(integer)-1])
print('key2 ',ans2)
整数部分是4.000000,小数部分是0.750000
key1 3.75
key2 9.75
python--pandas 分位数相关推荐
- Python pandas用法
Python pandas用法 无味之味关注 12019.01.10 15:43:25字数 2,877阅读 91,914 介绍 在Python中,pandas是基于NumPy数组构建的,使数据预处理. ...
- [转载] Python pandas数据分析中常用方法
参考链接: Python | Pandas处理文本text数据 官方教程 读取写入文件 官方IO 读取 写入 read_csv to_csv read_excel to_excel read_hdf ...
- Python | Pandas | 统计学分析:众数、中位数、偏度等
Last Modified: 2022/1/20 #todo: python 计算众数.中位数.分位数.偏度.峰度 Python | Pandas | 统计学分析 前言 参考链接 前言 参考链接 本文 ...
- blankcount函数python,Python pandas常用函数详解
本文研究的主要是pandas常用函数,具体介绍如下. 1 import语句 2 文件读取 df = pd.read_csv(path='file.csv') 参数:header=None 用默认列名, ...
- python pandas库读取excel/csv中指定行或列数据详解
通过阅读表格,可以发现Pandas中提供了非常丰富的数据读写方法,下面这篇文章主要给大家介绍了关于python利用pandas库读取excel/csv中指定行或列数据的相关资料,需要的朋友可以参考下 ...
- python pandas 独热编码
python pandas 独热编码 import pandas as pd df1 = pd.DataFrame({'姓名': ['周', '武', '郑'],'成绩': [100, 96, 77] ...
- python pandas 读写 csv 文件
python pandas 读写 csv 文件 具体看官方文档 https://www.pypandas.cn/docs/user_guide/io.html#csv-文本文件 import pand ...
- python pandas DataFrame 替换 NaN 值 和 删除 NaN 所在的行。
python pandas DataFrame 替换 NaN 值 和 删除 NaN 所在的行. import pandas as pd import numpy as np df1 = pd.Data ...
- python pandas DataFrame 查找NaN所在的位置
python pandas DataFrame 查找 NaN 所在的位置 import pandas as pd import numpy as np df1 = pd.DataFrame({'日期' ...
- python pandas dataframe 列 转换为离散值
python pandas dataframe 列 转换为离散值 import pandas as pd import numpy as np df1 = pd.DataFrame({'日期': [' ...
最新文章
- Exchange企业实战技巧(3)配置Exchange证书
- 又搜集一批项目源码,同样改改就能用
- opengl加载显示3D模型STL类型文件
- python等腰梯形_简单空实心图形打印|Python练习系列[3]
- 为什么要使用 Node.js
- 斯蒂芬金被退稿_斯蒂芬·金(Stephen King)对技术作家的实用建议
- SpringCloud工作笔记102---苞米豆mybitis增强工具
- Wampserver_开启CURL
- PDO和MySQLi , MySQL区别与选择?
- STM32电机控制--API函数应用
- python小波图像去噪_小波去噪
- # 飞书APP集成平台-数字化落地
- 大漠插件后台绑定方式: 逆水寒
- Android imagebutton美化+edittext美化 实现登录界面美化
- AI Earth ——开发者模式案例8:利用Landsat-8数据进行地表温度反演
- 华为鸿蒙应用名称,国产自主系统名字定了 华为鸿蒙商标已注册公告
- 阿贝不变量等三个重要公式的推导
- 2021-05上海自行车展
- 5.31 京东618热爱V1.6 批量账户使用教程
- 2021中国电信数据分析笔试
热门文章
- 访问网络计算机的盘符,win7系统下如何禁止访问指定盘符保护电脑安全
- Windows系统版本判断
- oracle 得到一个树,Related to Oracle SQL 关于树形数据的遍历
- python中空格字符是什么_关于Python中空格字符串处理的技巧总结
- 判断是否是数字类型php_PHP 判断是否为数字
- 健康管理-健康的概念和健康管理目标特点
- tensorflow随笔-tensorflow版本号
- 【深度学习】CVPR 2022 | 百变发型!中科大/微软/港城大提出HairCLIP:基于文本和参考图像的头发编辑方法...
- 【CV】计算机视觉领域有哪些不错的博客?
- 【NLP】用code2vec、glow和spaCy进行词嵌入