累积分布函数CDF

  • 1. CDF(cumulative distribution function)
  • 2.累积分布函数(CDF)的使用
  • 3. 累积分布函数的特点
  • 4. PDF (probability density function)
  • 5. 例子

1. CDF(cumulative distribution function)

从数学上来说,对于连续型随机变量,累积分布函数(Cumulative Distribution Function, 简称CDF)是概率分布函数的积分。
累积分布函数就是 分布函数 。

对于一维数据的可视化,直方图(Histogram)与核密度估计(Kernel Density Estimates)可以很好的表示各个数据值的概率分布,但在表示数据累积分布上这两种方法就无能为力了。

数据的累积分布,也即小于等于当前数据值的所有数据的概率分布,对于表示数据点在某个区间内出现的概率有很大的帮助。

2.累积分布函数(CDF)的使用

以-4到4之间分布的10000个数据点为例,绘制成直方图与核密度估计是这样的:



这两张图可以很好的表示-4到4之间任意数据值的概率大小,但是在回答下面几个问题的时候就比较困难了:

  • 所有大于2的数据点在总数据集中所占比例约有多大?

  • 所有大于1.3而小于2的数据点在总数据集中所占比例是多少?

在上述例子中,数据集大致遵循正态分布,因此从直方图或核密度估计的结果中推测这两个问题的答案还是可能的;但是对于不规则的概率分布曲线来说,这样做就基本上行不通了。回答上述问题的通用方法是绘制累积分布函数图:

根据这张累积分布函数图,可以很方便地回答之前的两个问题:

  • CDF中横轴上的2对应的Y值约为0.98,因此所有大于2的数据点所占比例约为2%。

  • CDF中横轴上的1.3对应的Y值约为0.75,因此所有介于1.3和2之间的数据点所占比例约为23% (0.98-0.75)。

3. 累积分布函数的特点

与直方图、核密度估计相比,累积分布函数存在以下几个特点:

  • 累积分布函数是X轴单调递增函数。

  • 累积分布函数更加平滑,图像中噪音更小。

  • 累积分布函数没有引入带宽等外部概念,因此不会丢失任何数据信息。对于给定的数据集,累积分布函数是唯一的。

  • 所有的CDF中,在x趋近最小值时,CDF趋近于0,当x趋近最大值时,CDF趋近与1(100%)

4. PDF (probability density function)

PDF:连续型随机变量的概率密度函数是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。

概率密度函数,描述可能性的变化情况,比如正态分布密度函数,给定一个值, 判断这个值在该正态分布中所在的位置后, 获得其他数据高于该值或低于该值的比例。

CDF:能完整描述一个实数随机变量x的概率分布,是概率密度函数的积分。随机变量小于或者等于某个数值的概率P(X<=x)即:F(x) = P(X<=x)。

可使用 CDF 确定取自总体的随机观测值将小于或等于特定值的概率。还可以使用此信息来确定观测值将大于特定值或介于两个值之间的概率。

对于所有实数x,CDF(cumulative distribution function),与概率密度函数PDF(probability density function)相对。任何一个CDF,是一个不减函数,累积和为1。累计分段概率值就是所有比给定x小的数在数据集中所占的比例。任意特定点处的填充x的 CDF 等于 PDF 曲线下直至该点左侧阴影面积。

5. 例子

import pandas as pd
import matplotlib.pyplot as plt
import numpy as npdata = []
data = pd.read_csv("D:\\dataset.csv", header=None)
print(data)
denominator = len(data[0])  # 分母数量
Data = pd.Series(data[0])  # 将数据转换为Series利用分组频数计算
Fre = Data.value_counts()
Fre_sort = Fre.sort_index(axis=0, ascending=True)
Fre_df = Fre_sort.reset_index()  # 将Series数据转换为DataFrame
Fre_df[0] = Fre_df[0] / denominator  # 转换成概率
Fre_df.columns = ['Rds', 'Fre']
Fre_df['cumsum'] = np.cumsum(Fre_df['Fre'])
plot = plt.figure()
ax1 = plot.add_subplot(1, 1, 1)
ax1.plot(Fre_df['Rds'], Fre_df['cumsum'])
ax1.set_title("CDF")
ax1.set_xlabel("Rds")
ax1.set_ylabel("P")
ax1.set_xlim(0.1, 0.5)
plt.show()

概率分布函数(累积概率函数),概率密度函数

Python中概率累计分布函数(CDF)分析

4.累积分布函数CDF相关推荐

  1. matlab累积概率分布,[转载]Matlab累积分布函数cdf与概率密度函数pdf

    累积分布函数cdf (Cumulative Distribution Function) 背景知识:http://www.lifelaf.com/blog/?p=746 语法 y = cdf('nam ...

  2. matlab求莱斯分布pdf,Matlab累积分布函数cdf与概率密度函数pdf

    累积分布函数cdf (Cumulative Distribution Function) 背景知识:http://www.lifelaf.com/blog/?p=746 语法 y = cdf('nam ...

  3. 概率质量函数(PMF)、概率密度函数(PDF)和累积分布函数(CDF)定义

    定义 概率质量函数(probability mass function,PMF) 概率密度函数(probability density function,PDF) 累积分布函数(Cumulative ...

  4. Excel绘制累积分布函数CDF(Cumulative Distribution Function)

    一.累积分布函数(Cumulative Distribution Function) 累积分布函数(Cumulative Distribution Function),又叫分布函数,是概率密度函数的积 ...

  5. 互补误差函数erfc的近似估计,累积分布函数CDF的计算

    最近由于需要计算累积分布函数(Cumulative Distribution Function/CDF) ,根据公式转化需要计算互补误差函数(erfc函数),在C++11标准库中是有这个函数的,但是比 ...

  6. 概率质量函数(PMF)、概率密度函数(PDF)、累积分布函数(CDF)

    1.概率分布函数(Probability Distribution Functions) 笔记来源:Probability Distribution Functions (PMF, PDF, CDF) ...

  7. matlab使用cdfplot画累积分布函数CDF图像

    假设现有一组数据,我们需要画出他的累积分布函数图像 这里我们通过正态分布随机生成两组数据 data1=normrnd(0,5,[1,500]); data2=abs(normrnd(0,5,[1,50 ...

  8. 累积分布函数(CDF)

    累积分布函数(Cumulative Distribution Function),又叫分布函数,是概率密度函数的积分,能完整描述一个实随机变量X的概率分布. 对于所有实数 xxx,累积分布函数定义如下 ...

  9. 高斯分布概率密度函数(PDF)和累积分布函数(CDF)

    正态分布(Normal distribution)又名高斯分布(Gaussian distribution),是一个在数学.物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力. ...

最新文章

  1. 记录一下CMake编译opencv_cuda时的易错点
  2. iOS macOS的后渗透利用工具:EggShell
  3. DataGrid中页导航栏的自定义样式
  4. oracle 工单查so,查询工单列表
  5. 【Linux网络编程】多播、组播
  6. JMS学习一(JMS介绍)
  7. windows环境下32位汇编语言程序设计 90盘_程序设计作业题汇总
  8. ProtecTIER网关演绎重复数据删除的硬道理
  9. ArcGIS制图表达Representation实战篇3-控制点
  10. 三角形周长最短问题_1.八年级数学:DE平分ABC的周长?怎么求DE的长?你想了很久吧?...
  11. 攻防世界web新手题答案_一个好的web前端开发者,是怎么学习的?
  12. android 9视频播放器,通用视频播放器Android版本9.10.18下载
  13. 思岚科技RPlidar A3激光雷达ROS源码详解
  14. 如何设计一个网页版音乐播放器
  15. 怎么不让WORD自动检查语法和拼写错误,福利在这里,不让WORD自动检查语法和拼写错误该如何设置
  16. 刚装新系统环境mscorsvw.exe进程占用CPU资料50%以上的原因
  17. SQL——语法基础篇(上)
  18. WeBug3.0靶场环境搭建与搭建资源分享
  19. 可以在线编译运行代码的网站(支持Python)
  20. 算法设计 - 寻找一个字符串的重复子串LRS

热门文章

  1. Canvas实现网页星空背景粒子动效跟随光标
  2. 书籍推荐《4点起床》舒适而高效的作息方式
  3. 坚定融合网络 Qlogic心态开放广结伙伴
  4. Revit 版本对应的 Dynamo 版本
  5. 搜索专题小结:迭代加深搜索
  6. [音乐天堂]Ce train qui s’en va 离站的火车
  7. 括号匹配openjudge c语言,OpenJudge计算概论-扩号匹配问题【这个用到了栈的思想】...
  8. 百度人工智能-写作文和文案
  9. 中文拼写纠错_[NLP]中文拼写检纠错
  10. WCDMA无线信号分析原理与实践(四)