本文简要介绍统计学中PDF (probability density function) 和 CDF (cumulative distribution function) 之间的差异。

随机变量

再讨论PDF 和 CDF之前,我们首先需要理解随机变量。

随机变量通常用x表示,表示一些随机过程中产生的数值类型结果,分为两类:离散和连续。

离散随机变量

离散随机变量(discrete random variable) 仅能够表示可数的离散值,如1,2,100,1000等。
离散随机变量的示例包括:

  • 抛20次硬币,正面朝上的次数
  • 扔骰子100次,其中为4点的次数

连续随机变量

连续随机变量(continuous random variable)有无数取值可能,举例:

  • 身高
  • 体重
  • 跑3公里所需时间

身高为170cm,170.01,169.98 等等,身高值有无限可能的值。

经验法则:如果你能够数出结果的个数,则为离散随机变量(例如,计算硬币正面落地的次数)。但如果你能够测量结果,则为连续的随机变量(例如测量,身高,体重,时间等)。

概率密度函数(Probability Density Functions)

概率密度函数(pdf)随机变量取某个值的概率。举例扔骰子,用x表示获得的点数,那么PDF可以描述结果的分布情况:

P(x < 1) : 0

P(x = 1) : 1/6

P(x = 2) : 1/6

P(x = 3) : 1/6

P(x = 4) : 1/6

P(x = 5) : 1/6

P(x = 6) : 1/6

P(x > 6) : 0

上面示例结果为离散变量,x只能为整数。对于连续随机变量,不能直接使用PDF,因为x取任何精确值的概率几乎为零。

假设想了解特定餐厅面包的重量为0.15公斤的概率,因为重量是连续变量,所以它有无限个值。如可能为0.15001,或0.148 等,完全为0.15的概率几乎为零。

累积分布函数(Cumulative Distribution Functions)

累积分布函数(CDF) 是随机变量取值小于或等于x的概率。举例扔骰子,用x表示获得的点数,那么CDF可以描述结果的分布情况:

P(x ≤ 0) : 0

P(x ≤ 1) : 1/6

P(x ≤ 2) : 2/6

P(x ≤ 3) : 3/6

P(x ≤ 4) : 4/6

P(x ≤ 5) : 5/6

P(x ≤ 6) : 6/6

P(x > 6) : 0

我们看到x概率小于等于6的概率为1,因为骰子的点数可能为1~6,所以概率为100%。上面示例是针对离散随机变量,CDF也可以用于连续随机变量。

CDF有下列一些属性:

  • 随机变量取值小于最小值的概率为零,上面示例中小于1的概率为零;

  • 随机变量取值小于或等于最大值的概率为1,扔骰子的点数只能为1~6中的一个;

  • CDF总为非递减函数。如骰子点数小于等于1的概率为1/6,小于等于2的概率为2/6,依此类推,总是非递减的。

下面示例展示如何计算正太分布的累积概率分布,以及特定范围内变量的累积概率分布:

# 计算正太分布中随机变量小于等于 1.96 的概率
pnorm(1.96)# 0.9750021# 计算正太分布中随机变量大于 1.96的概率
pnorm(1.96, lower.tail=FALSE)# 0.0249979# 定义序列范围
x <- seq(-4, 4, .01)# 计算普通累积概率分布
prob <- pnorm(x)# 图示累积概率分布
plot(x, prob, type="l")
abline(v = 1.96, col="red", lty=3)

1.96处的红线,表示小于等于1.96的累积概率大概为97.5%

CDF 和 PDF 之间的关系

在计算角度来看,概率密度函数(pdf)是累积分布函数(cdf)的导数。

pdf曲线下的面积在负无穷到x之间等于cdf上x的值。

要深入解释pdf和cdf之间的关系,以及证明为什么pdf是cdf的导数,请参阅统计教科书。

累积分布函数与概率密度函数的区别相关推荐

  1. 随机变量 的 分布函数 与 概率密度函数 的区别

    目录 1.分布函数 2.概率密度函数 1.分布函数 分布函数 显示了随机变量的取值落在某个区间上的概率,是一种不减函数. 设 X 是一个随机变量,x 是任意实数,函数 成为 X 的分布函数.分布函数是 ...

  2. 《概率论与数理统计》之概率函数、概率分布函数与概率密度函数理解

    文章目录 写在前面 离散型随机变量与连续型随机变量 离散型随机变量的概率函数与概率分布函数 连续型随机变量的概率密度函数与概率分布函数 总结 REF 写在前面 如果有大一大二的新生看到这篇博文,如果你 ...

  3. 如何简单理解概率分布函数和概率密度函数?

    本篇文章是在<应该如何理解概率分布函数和概率密度函数?>的基础上整理来的.非常感谢原作者. 目录 1 先从离散型随机变量和连续性随机变量说起 2 离散型随机变量的概率函数,概率分布和分布函 ...

  4. 如何理解概率分布函数和概率密度函数?

    我的理解: 当是离散型时,概率函数为pi=P(X=ai)(i=1,2,3,4,5,6),每次只能取一个点的概率:把所有可能的离散型随机变量的值分布和值的概率都列举出来那就是概率分布:概率分布函数就是在 ...

  5. 通俗理解:概率分布函数、概率密度函数

    这篇文章通俗地解释了概率论的两个基石函数:概率分布函数.概率密度函数,建议不熟悉的同学,认真阅读. 1 先从离散型随机变量和连续性随机变量说起 对于如何分辨离散型随机变量和连续性随机变量,在贾俊平老师 ...

  6. 【数学】1.分布函数与概率密度函数

    学习链接:https://zhuanlan.zhihu.com/p/48140593 随机变量分为离散型(discrete).连续型(continuous):变量的取值来自一个集合,可以是有限集,也可 ...

  7. 概率分布、概率密度、概率分布函数、概率密度函数

    今天突然看到概率分布.概率密度函数等概念,有点懵,赶紧复习以下. 理解相关概念首先要区分的是变量类型,离散变量与连续变量,不同的变量对应不同的概率描述方法,我们分开来看. 离散变量 概率分布.概率密度 ...

  8. 贝叶斯详解、概率、概率分布函数、概率密度函数之间的关系

    贝叶斯 概率.概率分布函数.概率密度函数之间的关系 矩阵的逆 范数的理解

  9. 概率分布函数、概率分布律、概率密度函数的区别。

    概率分布函数(又称分布函数) 累积 F(x) = P{X<x}, x∈(﹣无穷,+无穷) 概率分布律(又成分布律,针对离散型变量) 单个 P(X=Xk)=Pk, k = 1,2,3,- 概率密度 ...

最新文章

  1. ruby实时查看日志
  2. Dubbo原码解析(version:2.5.3)
  3. IIS HTTP 错误 404.17 - Not Found 解决方法
  4. 训练MNIST数据集模型
  5. 面试 4 个月,最终入职大厂经验分享!
  6. antlr 教程_ANTLR教程– Hello Word
  7. TypeError: cannot unpack non-iterable NoneType object
  8. Flutter 气泡背景效果 仿苹果桌面运动的气泡
  9. android获取详细地址,Android获取当前子网掩码地址(亲测可用)
  10. linux TCP协议(1)---连接管理与状态机
  11. Android 下拉菜单列表客制化处理
  12. android和iOS平台的崩溃捕获和收集
  13. 数据管理DMS移动版之2018新年巨献
  14. Java并发编程模拟管程(霍尔Hoare管程、汉森Hansan管程、MESA管程)
  15. nnU-Net论文笔记
  16. WebSocket接收多种子协议
  17. 【厄舍府的倒塌】超脱
  18. GBase XDM集群服务配置
  19. AngularJS博友的笔记教程
  20. C# winform 打印预览

热门文章

  1. matlab 信号 滤波,大仙带你学matlab信号处理和滤波去噪
  2. 关于php switch中的一些坑
  3. 国际:Ruby、Python不能威胁Java的13个理由
  4. 【分布式训练-PS】
  5. oracle删除语句
  6. 【记录】优化油猴插件【BD网盘播放器】
  7. android studio操作手机相机,Android Studio 调用Camera实现拍照功能
  8. codePush热更新
  9. 手写字体识别MINST的两种方法
  10. 利用鸿鹄优化共享储能的SCADA 系统功能,赋能用户数据自助分析