计算方法与举例

为了更一般化,在计算的过程中,我们考虑p分位。当p=0.25 0.5 0.75 时,就是在计算四分位数。

首先确定p分位数的位置(有两种方法):

方法1 pos = (n+1)*p
方法2 pos = 1+(n-1)*p

pandas 中使用的是方法2确定的。

计算

df = pd.DataFrame(np.array([[1, 1], [2, 10], [3, 100], [4, 100]]),columns=['a', 'b'])
print(df.quantile(.1))

结果是:

a    1.3
b    3.7
Name: 0.1, dtype: float64

默认使用的是linear 插值

计算a列
pos = 1 + (4 - 1)*0.1 = 1.3
fraction = 0.3

value = 1 + (2 - 1) * 0.3 = 1.3

计算b列
pos = 1.3
value = 1 + (10 - 1) * 0.3 = 3.7

在b中,假如pos等于2.5呢,即在2-3之间,那i对应就是10,j对应就是100,ret = 10 + (100-10) * 0.5 = 55

Pandas Percentile计算方法相关推荐

  1. 解析金融反欺诈技术的应用与实践

    统计学分为两大部分,描述性统计学和推断性统计学.而描述性统计学在建模的时候往往是很重要而又容易被人忽略的一步, 而它的作用往往如下: 1.发现数据中的异常 2.通过分布图发现离群值点 3.检查数据缺失 ...

  2. 数据分析之python数据计算方法汇总(math|numpy|pandas)

    数据分析之python数据计算方法上篇(math|numpy)_Backup and share的博客-CSDN博客 本文重点介绍pandas,math和numpy参见上篇> 目录 一.简介与创 ...

  3. pandas以前笔记

    # -*- coding: utf-8 -*- """ Created on Sat Jul 21 20:06:20 2018@author: heimi "& ...

  4. Pandas入门教程

    pandas是基于NumPy的一种数据分析工具,在机器学习任务中,我们首先需要对数据进行清洗和编辑等工作,pandas库大大简化了我们的工作量,熟练并掌握pandas常规用法是正确构建机器学习模型的第 ...

  5. Pandas处理时序数据(初学者必会)!

    ↑↑↑关注后"星标"Datawhale每日干货 & 每月组队学习,不错过Datawhale干货 作者:耿远昊,Datawhale成员,华东师范大学 时序数据是指时间序列数据 ...

  6. 数据分析之Pandas缺失数据处理

    ↑↑↑关注后"星标"Datawhale每日干货 & 每月组队学习,不错过Datawhale干货 作者:耿远昊,Datawhale成员,华东师范大学Pandas 是一个强大的 ...

  7. 让数据分析更便捷快速,了解这12种Numpy和Pandas函数

    选自TowardsDataScience 作者:Kunal Dhariwal 机器之心编译 我们都知道,Numpy 是 Python 环境下的扩展程序库,支持大量的维度数组和矩阵运算:Pandas 也 ...

  8. pandas使用cut函数基于分位数进行连续值分箱(手动计算分位数)处理后出现NaN值原因及解决

    pandas使用cut函数基于分位数进行连续值分箱(手动计算分位数)处理后出现NaN值原因及解决 目录 pandas使用cut函数基于分位数进行连续值分箱(手动计算分位数)处理后出现NaN值原因及解决 ...

  9. matplotlib绘制带比例(percentile)的堆叠(stacked)条形图(bar plot)

    matplotlib绘制带比例(percentile)的堆叠(stacked)条形图(bar plot) 导入包: %matplotlib inline import pandas as pd imp ...

最新文章

  1. Go 学习笔记(60)— Go 第三方库之 go-redis(初始化 redis、操作 string、操作 list、操作 set、操作 hset)
  2. Python将classification_report的结论转化为字典(dict)形式并提取模型的灵敏度(sensitivity)、特异度(specificity)、PPV和NPV指标、混淆矩阵图
  3. OkHttp3 websocket
  4. springmvc 使用fastjson 处理 json 数据时中文乱码
  5. linux平台 一个简单的helloworld静态库的制作与使用
  6. 亚马逊评价抓取插件_亚马逊运营必备插件
  7. 述说互联网1.0时代的巨头Yahoo的25年消亡史,传奇巨头落幕的故事
  8. LeetCode 1057. 校园自行车分配(map有序+贪心)
  9. c语言switch scanf语句,c语言switch语句 谢谢·!~!~
  10. 设计师职场提升效率品质素材网,一个足矣
  11. 【转】用photoshop批量修改图片尺寸
  12. 全国草地资源类型分布数据/植被类型分布数据/土地利用类型分布数据
  13. vofuria的开发(4)更换目标图片(target)
  14. 海康播放视频Demo
  15. Mac/Linux下使用vim出现E45: ‘readonly‘ option is set (add ! to override)错误
  16. 推荐系统实战(四)——利用社交网络数据
  17. 10 个最佳 WordPress 幻灯片插件
  18. Descriptive Essay文章内容怎么写?
  19. 2022年行研行业研究报告
  20. AutoRunner4.5结合真实项目crm客户管理系统进行界面功能自动化测试教学资料(登录)

热门文章

  1. unity - 二进制文件操作-存储与读取
  2. jmeter菜鸟教程(jmeter安装教程)
  3. android技术篇(三)解密data区
  4. Chapter 20-APIs(应用程序编程接口)
  5. Google APIs 学习/使用
  6. 如何卸载腾讯云的云服务器主机安全云镜监控程序
  7. 逆向思维赚钱法则 真正赚钱的暴利项目
  8. 微信java版_JAVA版微信支付V3-完全版
  9. 千岛湖2日团建旅行!游览天下第一秀水,感受湖岛遍布的磅礴气势!_团建拓展_嗨牛团建_杭州站...
  10. mac pe 制作教程