什么是分位数?

显然,分位数是用来定位的,表示某个样本在整个样本空间中的位置信息。

通过CDF(累积分布函数)可以很好地理解分位数的概念。CDF是一个单调递增的函数,F(q) = F(x<=q) 。CDF曲线中横轴是随机变量的取值,竖轴是小于某个取值的概率。

由于CDF单调递增,因此一定存在一个逆函数F-1。F-1以小于某个取值的概率为输入,以对应的随机变量的取值为输出。

如果已知P(X<=xalpha) = alpha  = F(Xalpha) ,则通过CDF的逆F-1可直接求出对应的Xalpha的取值Xalpha=F-1(alpha),Xalpha即为F的alpha分位点。

以下是一个均值=10,标准差=0.5的正态分布概率密度曲线的例子,x=9.020的垂线与该分布的概率密度曲线和X轴所围成的左侧区域面积=0.025,

该面积表示在随机变量X的总体分布中,有2.5%的值小于9.020,也就是说在总体分布中,随机变量X的取值小于9.020的概率为2.5%。

同样,x=10.98的垂线与该分布的概率密度曲线和X轴所围成的右侧区域面积=0.025,该面积表示在随机变量X的总体分布中,有2.5%的值大于10.98,

也就是说在总体分布中,随机变量X的取值大于10.98的概率为2.5%(也即是随机变量X的取值小于10.98的概率为97.5%)。

在这个分布中,x=9.020的值被称为X的2.5%分位数(即:X2.5%=9.020),x=10.98的值被称为X的97.5%分位数(X97.5%=10.98)。

随机变量X有95%(即:97.5% - 2.5%=95%)的取值落在9.020至10.98之间。每个分位数都是随机变量所有可能取值中的某个值。

按照定义,若某个值Xp被称为随机变量X的p分位数,则随机变量X的取值小于Xp的概率为p。


以下是该正态分布对应的累积概率分布曲线,该曲线的纵轴表示的是累积概率,比如:x=9.020对应的累积概率为2.5%(即:随机变量X的取值小于x=9.020的概率为2.5%),

x=10对应的累积概率为50%(即:随机变量X的取值小于x=10的概率为50%), x=10.98对应的累积概率为97.5%(即:随机变量X的取值小于x=10.98的概率为97.5%)。


分位数的概念很重要,我们在研究过程能力时,通常将被研究过程的特性的99.865%分位数与0.135%分位数的差值

(即:被研究过程的特性其中间99.73%的区间范围)定义为过程变异(Process Variation)的宽度。建立SPC控制图,

如:均值极差(Xbar-R)控制图时,也是分别以样本均值和样本极差的0.135%分位数和99.865%分位数作为下控制限(LCL)和上控制限(UCL)。

对于服从正态分布的过程的特性X,其0.135%分位数X0.135%=μ-3σ,99.865%分位数X99.865%=μ+ 3σ,因此,过程变异的宽度=6σ。

对于服从任意分布的随机变量,过程变异的宽度= X99.865% - X0.135%。以下是任意分布时的概率密度分布曲线的例子。

随机变量取值X=xi时的概率P(X=xi)=△xf(x),因为△x趋于0,因此在连续分布中,随机变量取值X=xi的概率P(X=xi)趋于0。

转载于:https://www.cnblogs.com/jiangkejie/p/10482636.html

分位数Quantiles相关推荐

  1. linux 如何运行r脚本,Linux系统下如何debug R脚本

    如果是ubuntu  opensuse 系统 推荐用Rstudio . 我们可以输人help(debug)去查看这函数的说明及指令. 这里用by.quantiles做例子,逐步展示编写程序及除错的过程 ...

  2. 基于Wide Deep Learning的推荐系统

    我们先来看下Google Inc的paper:Wide & Deep Learning for Recommender Systems. 一.介绍 推荐系统可以看成是一个搜索排序系统,其中输入 ...

  3. 用Python对淘宝用户行为数据的分析

    目录 项目前言 一.分析目的 二.数据获取与理解 1.数据来源 2.理解数据 三.具体做法 1.导入并清洗数据 3.1.1.把时间戳改为datetime类型 3.1.2.查看是否存在重复的行数据 3. ...

  4. 【Python统计与数据分析实战_01】位置与分散程度的度量

    数据描述性分析 1.描述统计量 1.1 位置与分散程度的度量 1.1.1 例子一 单维数组 1.1.2 例子二 多维数组 1.2 关系度量 1.3 分布形状的度量 1.3.1 统计量:偏度和峰度 1. ...

  5. 分位数(quantiles)、Z-score 与 F-score

    0. 分位数(quantiles) 因为累计分布函数(cdf,F−1)是单调增函数,因此其有反函数,不妨记为 F−1. 其真实的含义在于,如果 F 是 X 的 cdf,则 F−1(α) 的函数值为: ...

  6. 分位数和分位线(Quantiles and Percentiles)

    分位数有种积分(累积)的含义在. 分位数(即将数据由低至高排列,小于该数的数据占总体的比例达到时最终落到的数): 10%:3000元 20%:5200元 50%:20000元 80%:41500元 9 ...

  7. python dataframe 分位数_Python pandas.DataFrame.quantile函数方法的使用

    DataFrame.quantile(self, q=0.5, axis=0, numeric_only=True, interpolation='linear')[source] 返回在请求轴上的给 ...

  8. wald检验_笔记:分位数回归斜率相等性检验(Wald检验)

    首先我并不是统计学.数学类专业的,对很多统计模型搞不明白的,下文所写也仅是学渣的学习笔记吧,都是些基础操作,希望能帮到忙吧. 从毕业论文角度出发的分位数回归模型分享: 我是一个文科类.经济类的专业,我 ...

  9. Xgboost近似分位数算法

    一.近似算法 (二)提升树模型:Xgboost原理与实践这篇博客介绍了XGBoost使用exact greedy算法来寻找分割点建树,但是当数据量非常大难以被全部加载进内存时或者分布式环境下时,exa ...

最新文章

  1. [分享]五种提高 SQL 性能的方法
  2. 软件设计原则——接口隔离原则
  3. 月饼怎么吃才不胖,数据分析师教你选月饼
  4. oracle实验使用游标,Oracle数据库实验-PLSQL游标、过程、函数、包的使用
  5. 23 WM配置-策略-入库策略3-定义现有库存的附加策略I(Addition to Existing Stock Strategy)
  6. extract()函数:用于从一个date或者interval类型中截取到特定的部分
  7. 消息队列的使用场景和使用技巧
  8. excel转txt后导入mysql 20211207
  9. 推广引流方法有哪些方式,平台有哪些?各平台引流方法分析!
  10. canvas绘制表盘时钟
  11. Python 批量合并 Excel
  12. 笔记本计算机屏幕亮度暗,笔记本屏幕100%还是暗,win10电脑亮度调节失灵
  13. 深入理解以太坊 P2P 网络设计
  14. 助推建筑业数字化转型升级,紫光云再出招
  15. Spring-day01
  16. Vue传递对象数据,后台解析并使用
  17. lesson 21 mad or not 是不是疯了-把什么逼疯,be driving sb mad,live near 住在什么附近,过去将来时的被动式 will be done
  18. 用水流的概念来玩硬件(一)----阻抗匹配
  19. 第10章Tcl脚本编程(一)
  20. 北大AI公开课第七课--AI赋能 智赢未来by科大讯飞胡郁

热门文章

  1. 数据库作业:第七章: 数据库设计
  2. 为什么有时ping不通www baidu com但可以访问www baidu com网页
  3. substring与substr的区别
  4. ManjaroLinux扩展显示器,连接显示器。
  5. 深度学习训练之optimizer优化器(BGD、SGD、MBGD、SGDM、NAG、AdaGrad、AdaDelta、Adam)的最全系统详解
  6. java截取视频第几秒与另一个秒之间生成gif
  7. Hystrix断路器配置
  8. 斐波那契序列递归方法_斐波那契和卢卡斯序列
  9. hadoop生态圈详解
  10. 配置 WinHTTP 的代理设置