python dataframe 分位数_Python pandas.DataFrame.quantile函数方法的使用
DataFrame.quantile(self, q=0.5, axis=0, numeric_only=True, interpolation='linear')[source]
返回在请求轴上的给定的quantile值。
参数:q : float 或 array-like, 默认 0.5 (50% quantile)
要计算的quantile值在0 <= q <= 1之间。
axis : {0, 1, ‘index’, ‘columns’}(默认为 0)
行为0或' index ',列为1或'columns'。
numeric_only : bool,默认值True
如果为False,也将计算datetime和timedelta数据的quantile。
interpolation: {‘linear’, ‘lower’, ‘higher’, ‘midpoint’, ‘nearest’}
这个可选参数指定了当所需quantile位于两个数据点i和j之间时要使用的插值方法:
1) linear: i + (j - i) *fraction,其中分数是指数中被i和j包围的小数部分。
2) lower: i
3) higher: j
4) nearest: i或j,以最接近的为准。
5) midpoint: (i + j) / 2
返回值:Series或 DataFrame
如果q是数组,则将返回DataFrame,其中
index是q,列是self的列,值是quantiles。
如果q为float,则在
index是self的列,值是quantiles。
例子>>> df = pd.DataFrame(np.array([[1, 1], [2, 10], [3, 100], [4, 100]]),
... columns=['a', 'b'])
>>> df.quantile(.1)
a 1.3
b 3.7
Name: 0.1, dtype: float64
>>> df.quantile([.1, .5])
a b
0.1 1.3 3.7
0.5 2.5 55.0
指定numeric_only = False还将计算日期时间和时间增量数据的分位数>>> df = pd.DataFrame({'A': [1, 2],
... 'B': [pd.Timestamp('2010'),
... pd.Timestamp('2011')],
... 'C': [pd.Timedelta('1 days'),
... pd.Timedelta('2 days')]})
>>> df.quantile(0.5, numeric_only=False)
A 1.5
B 2010-07-02 12:00:00
C 1 days 12:00:00
Name: 0.5, dtype: object
python dataframe 分位数_Python pandas.DataFrame.quantile函数方法的使用相关推荐
- python boxplot用法_Python pandas.DataFrame.boxplot函数方法的使用
DataFrame.boxplot(column = None,by = None,ax = None,fontsize = None,rot = 0,grid = True,figsize = No ...
- python dataframe切片_python pandas dataframe 行列选择,切片操作方法
SQL中的select是根据列的名称来选取:Pandas则更为灵活,不但可根据列名称选取,还可以根据列所在的position(数字,在第几行第几列,注意pandas行列的position是从0开始)选 ...
- python dataframe排序_python – Pandas DataFrame排序忽略了这种情况
我在 Python中有一个Pandas数据帧.数据帧的内容来自 here.我稍微修改了"单个"列中第一个字母的大小写.这是我有的: import pandas as pd df = ...
- python boxplot用法_python pandas DataFrame.boxplot用法及代码示例
从DataFrame列制作箱形图. 从DataFrame列制作box-and-whisker图,可以选择按其他一些列进行分组.箱形图是一种通过四分位数以图形方式描绘数字数据组的方法.该框从数据的Q1四 ...
- pandas的quantile函数
pandas的quantile函数 quantile : 分位数的意思 一般为 0.25 0.5 0.75分位数 中数值的计算方法 设分位数为p : 分位数的值 = 1 + (n - 1) * p, ...
- python dataframe loc函数_python pandas.DataFrame.loc函数使用详解
官方函数 DataFrame.loc Access a group of rows and columns by label(s) or a boolean array. .loc[] is prim ...
- python数据去重的函数_python pandas dataframe 去重函数的具体使用
今天笔者想对pandas中的行进行去重操作,找了好久,才找到相关的函数 先看一个小例子 from pandas import Series, DataFrame data = DataFrame({' ...
- python中convert函数用法_Python Pandas DataFrame.tz_convert用法及代码示例
Pandas DataFrame是带有标签轴(行和列)的二维大小可变的,可能是异构的表格数据结构.算术运算在行和列标签上对齐.可以将其视为Series对象的dict-like容器.这是 Pandas ...
- python agg函数_Python pandas.DataFrame.agg函数方法的使用
DataFrame.agg(func, axis=0, *args, **kwargs) 使用指定axis上的一个或多个操作Aggregate. 参数:func: function, str, lis ...
最新文章
- ext-4.2之grid的高级应用:增删改查!
- 百度技术研发笔试题目1
- struts+hibernate+oracle+easyui实现lazyout组件的简单案例——DeptDao层代码
- Open vswitch 之Qos rate-limiting 原理
- fedora 安装docker
- javascript天生就具备类似c#中的委托功能
- 机器学习 | 特征选择(Feature Selection)
- 机器人动力学(牛顿欧拉推导)
- 华三路由交换配置命令_华三交换机-路由器配置命令
- oracle函数translate,oracle中Translate()函数用法
- SAP BASIS ADM100 中文版 Unit 7(1)
- 防止iOS自动识别数字为电话号码
- 处理器核(core)、处理器(cpu)区别
- Postgresql12 安装及设置远程访问
- oracle调用web severs,Oracle调用C#开发web services
- linux 并口这数据,PLIP--Linux 并口网络解决方法
- 已解决selenium.common.exceptions.WebDriverException: Messag: ‘geckodriver‘ executable needs to be in PA
- Norlit OS —— 自制操作系统 第0章 热身运动
- 母牛生小牛问题递归python实现
- 反跟单讲解1:重新认识期货反向跟单
热门文章
- 2022-2028年中国阻燃母料行业市场深度分析及发展规模预测报告
- \r \r\n \t的区别
- ERROR: epmd error for host 192: badarg (unknown POSIX error)
- Tengine AIFramework框架
- Python的Xpath介绍和语法详解
- Python数据挖掘:绘制直方图,设置上下限和步长,绘制子图
- 第二个Python程序:if,for,while,输出乘法口诀表
- SyntaxError: Non-ASCII character ‘\xe5‘ in file(xxlrt_1.py) on line 7, but no encoding declared;
- Android SurfaceView 黑背景的处理方法
- Can't add more than 2 views to a ViewSwitcher