一、引言

在《人工智能数学基础–概率与统计12:连续随机变量的概率密度函数以及正态分布》介绍了连续随机变量概率分布及概率密度函数以及正态分布,《人工智能数学基础–概率与统计13:连续随机变量的标准正态分布》介绍了标准正态分布,本文将继续介绍几个连续随机变量的分布函数。

二、指数分布

2.1、定义

若随机变量X有概率密度函数:f(x)={0当x≤0时λe−λx当x>0时f(x) = {\Huge \{}{\huge^{λe^{-λx}\;\;\;\;当x>0时}_{0\;\;\;\;\;\;\;\;\;\;\;\;当x≤0时}} f(x)={0当x≤0时λe−λx当x>0时​
则称X服从指数分布,其中λ为参数,其值大于0,当x大于0时,-λx为负数,因此该分布也称为负指数分布

对于指数分布来说,当x≤0时,f(x)= 0,表示随机变量取负值的概率为0,故X只取正值,函数f(x)在x=0处不连续。

2.2、指数分布的分布函数

指数分布的分布函数F(x)=∫−∞xf(t)d(t)={0当x≤0时1−e−λx当x>0时F(x)=∫_{-∞}^xf(t)d(t)\\\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;= {\Huge \{}{\Large^{1-e^{-λx}\;\;\;\;当x>0时}_{0\;\;\;\;\;\;\;\;\;\;\;\;当x≤0时}}F(x)=∫−∞x​f(t)d(t)={0当x≤0时1−e−λx当x>0时​

2.3、指数分布的适用场景及推导

指数分布最常见的一个场景是寿命分布。

设想一种大批生产的电子元件,其寿命X 是随机变量,以F(x)记X的分布函数。证明:在一定的条件下,F(x)就是指数分布的分布函数。

为了证明要进行技术上“无老化”的假定,就是说,“元件在时刻x尚为正常工作的条件下,其失效率总保持为某个常数λ>0,与x无关。失效率就是单位长度时间内失效的概率。用条件概率的形式,上述假定可表达为:
P(x≤X≤x+h∣X>x)/h=λ(h→0)P(x≤X≤x+h|X>x)/h=λ\;\;\;\;\;\;\;\;\;\;\;\;(h→0)P(x≤X≤x+h∣X>x)/h=λ(h→0)
此式解释如下

  1. 元件在时刻x时尚正常工作,表示其寿命大于x,即X>x;
  2. 在x处,长为h的时间段内失效,即x≤X≤x+h;
  3. 把这个条件概率除以时间段的长h,即得在x时刻的平均失效率;
  4. 令h→0,得瞬时失效率,按假定,它应为常数λ。

按条件概率的定义,注意到P(X>x)=1-F(x),又{X>x}{x≤X≤x+h}={x<X≤x+h}\{X>x\}\{x≤X≤x+h\}=\{x<X≤x+h\}{X>x}{x≤X≤x+h}={x<X≤x+h}
有P(x≤X≤x+h∣X>x)/h=P(x<X≤x+h)/(h(1−F(x)))=(F(x+h)−F(x))/h]/(1−F(x))→F′(x)/(1−F(x))=λP(x≤X≤x+h|X>x)/h=P(x<X≤x+h)/(h(1-F(x)))\\=(F(x+h)-F(x))/h]/(1-F(x))\\→F'(x)/(1-F(x))=λP(x≤X≤x+h∣X>x)/h=P(x<X≤x+h)/(h(1−F(x)))=(F(x+h)−F(x))/h]/(1−F(x))→F′(x)/(1−F(x))=λ
这个微分方程的通解为F(x)=1−Ce−λxF(x)=1-Ce^{-λx}F(x)=1−Ce−λx(x>0),当x≤0时,F(x)为0。常数C可用初始条件F(0)=0求出为1。

老猿注:

  1. 上面这个推导过程用到了极限的定义、条件概率公式、条件概率定义、分布函数的定义及性质,挺有意思的一个推导过程;
  2. F(x)=1−Ce−λxF(x)=1-Ce^{-λx}F(x)=1−Ce−λx(x>0)是通过微分方程求解得到的,这个过程老猿演示如下:
    设F(x)=y,则F ′ (x)/(1−F(x))=λ可以化为dy/(dx(1-y))=λ,则可得:
    dy/(1-y)=λdx,对该式两边求积分:∫ dy/(1-y)=∫λdx,则得到:
    -ln(1-y)+c1 = λx+c2
    ∴ln(1-y)=-λx+c3
    ∴1−y=e−λx+c3=ec3e−λx=Ce−λx1-y=e^{-λx+c3}=e^{c3}e^{-λx}=Ce^{-λx}1−y=e−λx+c3=ec3e−λx=Ce−λx
    ∴y=1-Ce−λxCe^{-λx}Ce−λx

注意整个推导过程中常数的和差幂运算的结果还是常数,因此有c1、c2、c3和C。

2.4、补充说明

从上面的推导过程可以知道λ的意义就是失效率,失效率越高,平均寿命就越小,因此指数分布描述了无老化时的寿命分布,但实际中“无老化”是不可能的,因而指数分布只是一种近似的寿命分布。对一些寿命长的元件,在初期阶段,老化现象很小,在这一阶段指数分布比较准确相当描述了其寿命分布。

三、威布尔分布

如果将指数分布推导过程中考虑老化的情况,则失效率会随时间上升而上升,故应取为一个x的增函数λxmλx^mλxm,其中λ和m都为大于0的常数。在这个条件下,按指数分布的推理,将得出:寿命分布F(x)满足微分方程F′(x)/[1−F(x)]=λxmF'(x)/[1-F(x)]=λx^mF′(x)/[1−F(x)]=λxm
结合F(0)=0,得出:F(x)=1−e−(λ/(m+1))xm+1F(x) = 1-e^{-(λ/(m+1))x^{m+1}}F(x)=1−e−(λ/(m+1))xm+1
取α = m+1(α>1),并把λ/(m+1)记为λ,得出:F(x)=1−e−λxα(x>0)F(x)=1-e^{-λx^α} \;\;\;\;\;\;\;\;(x>0)F(x)=1−e−λxα(x>0)
而当x≤0时F(x)=0,此时的函数F(x)就称为威布尔分布函数。此分布的密度函数为:
f(x)={0当x≤0时λαxα−1e−λxα当x>0时f(x) = {\Huge \{}{\huge^{λαx^{α -1}e^{-λx^α }\;\;\;\;当x>0时}_{0\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;当x≤0时}} f(x)={0当x≤0时λαxα−1e−λxα当x>0时​

威布尔分布和指数分布一样,在可靠性统计分析中占据重要地位,实际上指数分布是威布尔分布的α=1的特例。

三、均匀分布

3.1、定义

设随机变量X有概率密度函数:
f(x)={0其他1b−a当a≤x≤b时f(x) = {\Huge \{} ^{{\huge\frac{1}{b-a}}{\large\;\;\;\;\;\;\;\;\;\;\;\;当a≤x≤b时}}_{\large0\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;其他} f(x)={0其他b−a1​当a≤x≤b时​
则称X服从区间[a,b]上的均匀分布,记为X~R(a,b),这里a、b是常数,满足 -∞<a<b<∞。

均匀分布的分布函数为:

3.2、均匀分布的一种应用

对于一般分布函数F(x),如果X~R(0,1),且F(x)处处连续严格单调递增,其反函数G存在,且G(x) ~ F。

证明
∵{G(X)≤x}
∴{F(G(X))≤F(x)}
∴{X≤F(x)}
∵X ~ R(0,1)
∴R(0,1)的分布函数为F(x)=x(0<x<1)
∴P(G(X)≤x)=P(X≤F(x))=F(x)
∴G(X) ~ F

因此可以利用均匀分布实现对满足上述条件的一般分布F的模拟。

四、小结

本文是老猿学习中国科学技术大学出版社出版的陈希孺老先生的《概率论与数理统计》的总结和思考,在文中介绍了指数分布、威布尔分布和均匀分布的概念,以及其中一些推导过程,在文中根据老猿自己的理解补充说明了一些推导过程。

更多人工智能数学基础请参考专栏《人工智能数学基础》。

写博不易,敬请支持:

如果阅读本文于您有所获,敬请点赞、评论、收藏,谢谢大家的支持!

关于老猿的付费专栏

  1. 付费专栏《https://blog.csdn.net/laoyuanpython/category_9607725.html 使用PyQt开发图形界面Python应用》专门介绍基于Python的PyQt图形界面开发基础教程,对应文章目录为《 https://blog.csdn.net/LaoYuanPython/article/details/107580932 使用PyQt开发图形界面Python应用专栏目录》;
  2. 付费专栏《https://blog.csdn.net/laoyuanpython/category_10232926.html moviepy音视频开发专栏 )详细介绍moviepy音视频剪辑合成处理的类相关方法及使用相关方法进行相关剪辑合成场景的处理,对应文章目录为《https://blog.csdn.net/LaoYuanPython/article/details/107574583 moviepy音视频开发专栏文章目录》;
  3. 付费专栏《https://blog.csdn.net/laoyuanpython/category_10581071.html OpenCV-Python初学者疑难问题集》为《https://blog.csdn.net/laoyuanpython/category_9979286.html OpenCV-Python图形图像处理 》的伴生专栏,是笔者对OpenCV-Python图形图像处理学习中遇到的一些问题个人感悟的整合,相关资料基本上都是老猿反复研究的成果,有助于OpenCV-Python初学者比较深入地理解OpenCV,对应文章目录为《https://blog.csdn.net/LaoYuanPython/article/details/109713407 OpenCV-Python初学者疑难问题集专栏目录 》
  4. 付费专栏《https://blog.csdn.net/laoyuanpython/category_10762553.html Python爬虫入门 》站在一个互联网前端开发小白的角度介绍爬虫开发应知应会内容,包括爬虫入门的基础知识,以及爬取CSDN文章信息、博主信息、给文章点赞、评论等实战内容。

前两个专栏都适合有一定Python基础但无相关知识的小白读者学习,第三个专栏请大家结合《https://blog.csdn.net/laoyuanpython/category_9979286.html OpenCV-Python图形图像处理 》的学习使用。

对于缺乏Python基础的同仁,可以通过老猿的免费专栏《https://blog.csdn.net/laoyuanpython/category_9831699.html 专栏:Python基础教程目录)从零开始学习Python。

如果有兴趣也愿意支持老猿的读者,欢迎购买付费专栏。

老猿Python,跟老猿学Python!

☞ ░ 前往老猿Python博文目录 https://blog.csdn.net/LaoYuanPython ░

人工智能数学基础--概率与统计14:连续随机变量的指数分布、威布尔分布和均匀分布相关推荐

  1. 人工智能数学基础--概率与统计3:随机变量与概率分布

    一.随机变量 假设对一个样本空间的每个点,我们指定一个数,于是就在该样本空间上定义了一个函数,称这个函数为随机变量(random variable)或更确切地称之为随机函数. 随机变量通常用大写字母X ...

  2. 人工智能数学基础--概率与统计13:连续随机变量的标准正态分布

    一.引言 在<人工智能数学基础–概率与统计12:连续随机变量的概率密度函数以及正态分布>介绍了连续随机变量概率分布及概率密度函数的概念,并介绍了连续随机变量一个重要的概率密度函数:正态分布 ...

  3. 人工智能数学基础--概率与统计11:离散随机变量的超几何分布和负二项分布

    一.超几何分布 1.1.定义 假设N个产品中M个废品,以X记为从N个产品中随机抽出n个里面所包含的废品数m,则: P(X=m)=(mM)(n−mN−M)/(nN)P(X=m) = {\Large (^ ...

  4. 人工智能数学基础--概率与统计1:随机试验、样本空间、事件、概率公理定理以及条件概率和贝叶斯法则

    随机试验 我们都非常熟悉在科学研究和工程中试验的重要性.试验对我们是有用的,因为我们可以假定,在非常接近的确定条件下进行固定的试验,基本上会得到相同的结果.在这样的环境中,我们可以控制那些对试验结果有 ...

  5. 人工智能数学基础--概率与统计7:学习中一些术语的称呼或表示变化说明以及独立事件的一些补充推论

    一.概念表示变化说明 笔者最开始学习概率论时,是以美版M.R.斯皮格尔等著作的<概率与统计>作为教材学习,学习过程中发现部分内容理解困难,之所以这样,一是这本书的内容太古老,教材是2002 ...

  6. 人工智能数学基础--概率与统计2:排列组合的表示方法、二项式系数及斯特林近似

    ### 引言 在很多情况样本空间的样本点数不是非常大,从而直接计数样本点数获得概率并不困难. 当然,有些问题直接计数实际上是不可能的.计数要使用**组合分析**,这也称为一种精细的计数方法. 这些组合 ...

  7. 人工智能数学基础专栏目录

    ☞ ░ 前往老猿Python博文目录 ░ 本专栏为人工智能数学基础,相关内容介绍人工智能相关的数学知识,在老猿学习过程中,会将一些知识的基础知识都在本专栏内体现,尽量做到本专栏涉及知识点的内容闭环. ...

  8. MCS:连续随机变量——WeiBull分布

    Weibull 韦布尔分布,即韦伯分布(Weibull distribution),又称韦氏分布或威布尔分布,威布尔分布在可靠性工程中被广泛应用,尤其适用于机电类产品的磨损累计失效的分布形式.由于它可 ...

  9. 【概率与统计】聊聊一些常见的概率分布

    笔者:YY同学Serendipity 生命不息,代码不止.好玩的项目尽在GitHub 文章目录 离散概率分布 离散均匀分布(Discrete Uniform Distribution) 伯努利分布(B ...

最新文章

  1. 程序员因开发速度太慢而遭公司起诉,索赔金额高达90万!
  2. android从放弃到精通 第12天 勿忘初心
  3. 漂亮的html404页面源码,一个简单而又漂亮的404页面源码
  4. spring-声明式事务管理
  5. php oop 实际工作,PHP OOP注意点(一)
  6. JEECG参与2017年度最受欢迎开源项目投票,请投上宝贵一票
  7. 大数据:技术与应用实践指南_大数据技术与应用社团 社会实践总结篇
  8. Tiny Jpeg Decoder (JPEG解码程序) 源代码分析 1:解码文件头
  9. Boost Asio Work类
  10. 【测试】软件测试之测试用例的设计方法
  11. 零点起飞学java web_零点起飞学Java Web开发 (徐林林) 高清PDF扫描版 114M
  12. js原生拖拽的两种方法
  13. 一文读懂 Apache Pulsar详细解析和实战运用
  14. autojs ui界面模板3
  15. 几何光学学习笔记(12)- 3.9几种典型系统的理想光学系统性质 3.10 矩阵运算在几何光学中的应用
  16. python 权限认证 impala_python操作具有kerberos认证的hive(impala)
  17. Python中的各种占位符
  18. 同花顺编程语言是基于c,同花顺编程语言
  19. 升级Win11后Win安全中心丢失或者点击没反应的解决方法
  20. 某线下水果店销售数据分析

热门文章

  1. python 可视化解释模型
  2. 穆迪ESG解决方案事业部推出解决方案,帮助投资者评估各公司是否遵循联合国全球契约组织原则
  3. 计算机会计报表管理,会计电算化知识之报表管理模块的应用
  4. Fabric.js Failed to execute ‘toDataURL‘ on ‘HTMLCanvasElement‘: Tainted canvases may not be exported
  5. KB奇遇记(1):开篇
  6. 一颗二叉树中的结点个数与结点度数的关系
  7. 驾驶证——科目一技巧(四)
  8. 华钜同创:亚马逊开店提高产品复购率的七大方法
  9. matlab 如何查内置函数,关于Matlab的内置函数 ordqz的用法-经管之家官网!
  10. 信息学奥赛一本通(c++):1405:质数的和与积