目录

  • 写在前面
  • 起源与发展
    • 概率
    • 基本计数原理
  • 本质
  • 1. 随机变量(random variable)
    • 1.1 随机变量
    • 1.2 随机变量三要素
  • 2.分类
    • 2.1 离散型随机变量
    • 2.2 随机变量三要素(离散)
      • 1. 随机变量的取值
      • 2. 试验中每个随机变量对应取值的概率
      • 3. 随机变量的统计特征和度量方法
    • 2.2 连续型随机变量
      • 随机变量三要素(连续)
      • 1. 随机变量的取值
      • 2. 试验中对应区间取值的概率
      • 3. 随机变量的统计特征和度量方法
  • 3.总结
    • 本质
    • 三要素
  • 问题 :概率函数、概率分布函数、概率质量函数、概率密度函数?
  • 参考

写在前面

  • 随机试验
    随机试验就是试验结果呈现出不确定性的试验,且满足以下三个条件:

    1. 试验可在相同条件下重复进行;

    2. 试验的可能结果不止一个,且所有可能结果可事先预知;

    3. 每次试验的结果只有一个,但不能事先预知。

  • 样本空间
    随机试验的所有可能结果组成的集合称为样本空间。
    该集合的元素称为样本点。对于抛掷硬币试验,样本空间 = { 正面,反面 },正面就是此样本空间的一个样本点。

  • 随机事件
    随机事件样本空间的子集
    在每次试验中,当且仅当该子集中的任意一个元素发生时,称该随机事件发生。

  • 随机变量
    随机变量是定义在样本空间上的映射。通常是将样本空间映射到数字空间,这样做的目的是方便引入高等数学的方法来研究随机现象。

    随机事件与随机变量的区别?
    需要指出的是,对于随机事件A,P(A)表示随机事件发生的概率对于随机变量X,P(X)表示随机变量取值为X的概率。
    从某种意义上来说,与随机变量相比,随机事件更像是定义在样本空间上的随机常量。

    例如,在抛掷硬币试验中,将正面与1对应,反面与0对应,那么样本空间 = { 正面,反面 } 与 随机变量X = { 1,0 } 之间建立起了一一对应的关系。

    粗糙地理解:随机变量为一个函数,而事件可以是这个函数自变量的取值所对应的一个“说法”或者说“结果”,比如 x=0 (正面)或者 x=1(反面)

  • 频数与概率
    频数:一件事情发生的次数与实验次数的比值

  • 概率函数

起源与发展

概率

  • 概率与频率 & 大数定理与概率

    伯努利提出了 “大数定律”。伯努利认为,在试验不变的条件下,重复试验多次,随机事件的频率近似于它的概率。
    换句话说,伯努利用频率解释了概率。“大数定律”去处了概率最后一分“玄学”色彩,让概率变成了像物理化学那样的实验学科。

  • 概率论与“频数派” & 概率论与“贝叶斯派”

    “频率派”认为概率是重复尝试多次,某种结果出现的次数在尝试的总次数的比例。
    “贝叶斯派”认为概率是主观信念的强弱。

基本计数原理

  • 基本计数原理
  • 抽样(有/无序、重复/无重复)
    排列
    组合

本质

随机变量 = 函数/映射

概率函数 = 用函数的形式来表达概率

随机变量函数 = 复合函数

所以,概率密度函数就是随机变量和概率函数的复合函数。

(比如表示随机变量概率的概率函数以及表示随机变量分布的分布函数,)

1. 随机变量(random variable)

1.1 随机变量

随机变量 X = x

将样本空间中的每一个可能的试验结果关联到一个特定的数,这种试验结果与数的对应关系就形成了 随机变量

随机变量的本质是一个函数,是从样本空间的子集到实数的映射,将事件转换成一个数值。可以说,随机变量是“数值化”的实验结果。

1.2 随机变量三要素

一组随机变量,最关注的三个要素

  • 随机变量的取值
    试验结果对应的数被称为随机变量的取值
  • 试验中每个对应取值的概率
    注意区分:概率函数、概率分布函数
  • 随机变量的统计特征和度量方法
    期望、方差

2.分类

2.1 离散型随机变量


离散型随机变量:随机变量的取值只能是有限多个或者是可数的无限多个值。

2.2 随机变量三要素(离散)

1. 随机变量的取值

可以是试验的结果取值,比如 “抛掷骰子的结果点数为 2”;( y=x )
也可以是另一种映射值,比如 “连续抛掷硬币 10 次,其中硬币正面出现的次数”。( y=f(x) )

2. 试验中每个随机变量对应取值的概率

  • 概率表示:概率函数
    随机变量的概率表示用概率函数
    PX(x) = P(X=x)
    (注:连续型随机变量用的是概率密度函数)

  • 概率分布(离散变量):概率质量函数(PMF)

    离散变量的概率分布,即离散型 ‘’随机变量的值分布和值的概率分布列表‘’。(注意,是全部可能的取值)

    概率质量函数,PMF ( probability mass function ):
    将随机变量的每个值映射到其概率上。

(随机变量的分布列和概率质量函数其实就是一回事)

3. 随机变量的统计特征和度量方法

期望
方差

2.2 连续型随机变量

随机变量三要素(连续)

1. 随机变量的取值

随机变取值于连续区域,比如汽车的行驶速度、设备连续正常运行的时间等。

2. 试验中对应区间取值的概率

对于连续型随机变量,我们讨论的是某个区间内的概率,即P(a<X<b),而不是具体某一数值的概率。
例如:

图中的每一个柱状表示的是每一个小“区间”的概率(使用直方图(Histogram进行可视化),而不像离散型随机变量,每个点对应一个概率值。
PS:图中的曲线是核函数估计kdeplot拟合出来的,具体来说,核密度估计就是采用平滑的峰值函数(“核”)来拟合观察到的数据点,从而对真实的概率分布曲线进行模拟。

  • 概率表示:概率密度函数(PDF)

    连续型随机变量的概率函数叫做 概率密度函数(PDF,probability density function)

连续型随机变量的分布用分布函数表示

对分布函数求导则可以得到概率密度函数

3. 随机变量的统计特征和度量方法

期望
方差

3.总结

本质

  • 随机变量 = 函数/映射

  • 随机变量函数 = 复合函数(比如随机变量的概率函数)
    随机变量函数,类似复合函数。二者本质上是一回事情,都是两个一元映射构造的复合映射。

三要素

一组随机变量,最关注的三个要素

  • 随机变量的取值
    试验结果对应的数被称为随机变量的取值。可以是试验的结果取值,比如 “抛掷骰子的结果点数为 2”;( y=x )
    也可以是另一种映射值,比如 “连续抛掷硬币 10 次,其中硬币正面出现的次数”。( y=f(x) )

  • 试验中对应取值的概率
    随机变量在不同取值(离散型) / 区间(连续型) 下的概率:
    离散型:概率质量函数(即概率分布列/分布函数)的 取值
    连续型:概率密度函数(即概率分布函数求导之后)的曲线下面积

  • 随机变量的统计特征和度量方法
    期望
    方差

问题 :概率函数、概率分布函数、概率质量函数、概率密度函数?

1.概率函数、概率分布函数和概率密度函数的关系

从数学上看,分布函数F(x)=P(X<x),表示随机变量X的值小于x的概率。这个意义很容易理解。概率密度f(x)是概率分布F(x)在x处的关于x的一阶导数,即变化率。如果在某一x附近取非常小的一个邻域Δx,那么,随机变量X落在(x, x+Δx)内的概率约为f(x)Δx,即P(x<X<x+Δx)≈f(x)Δx。换句话说,概率密度f(x)是X落在x处“单位宽度”内的概率。“密度”一词可以由此理解。

2.概率分布函数和概率密度函数的区别

包络线为概率密度函数;
阴影部分为概率分布函数,表示x<x0范围内事件发生的概率;
概率分布函数是概率函数取值累加的结果,所以它又叫累积概率函数

3.概率质量函数和概率密度函数的区别

概率质量函数是对离散随机变量定义的,本身代表该值的概率;
概率密度函数是对连续随机变量定义的,本身不是概率,只有对连续随机变量的概率密度函数在某区间内进行积分后才是概率。

参考

  1. 概率论04 随机变量
  2. 连续型随机变量:分布与数字特征
  3. 应该如何理解概率分布函数和概率密度函数?

数学知识——概率统计(3):随机变量相关推荐

  1. 数学知识——概率统计(8)统计推断之参数估计:极大似然估计和最大后验概率

    目录 1. 统计推断 概念 问题表述 小结 参数估计 抽样分布 假设检验 2. 两大估计方法后面的学派 概率的定义 本质区别 3. 参数估计的思想 3.1 最大似然估计(MLE) 3.2 贝叶斯估计: ...

  2. 机器学习中的数学:概率统计

    内容亮点 详解 6 大核心板块:概率思想.随机变量.统计推断.随机过程.采样理论.概率模型,筑牢机器学习核心基础. 教你熟练使用 Python 工具库:依托 NumPy.SciPy.Matplotli ...

  3. python实现概率论与数理统计_《统计思维:程序员数学之概率统计》读书笔记

    更多 1.书籍信息 书名:Think Stats: Probability and Statistics for Programmers 译名:<统计思维:程序员数学之概率统计> 作者:A ...

  4. 《统计思维:程序员数学之概率统计》学习笔记 Chap.1-2

    最近在阅读Allen B. Downey所著的<统计思维:程序员数学之概率统计>,由于文章中大部分的函数操作都是基于作者自己写的模块thinkstats2,为了能够使用常用python库来 ...

  5. 机器学习中的数学(五)--概率统计

    写在前面 <机器学习中的数学>系列主要列举了在机器学习中用到的较多的数学知识,包括微积分,线性代数,概率统计,信息论以及凸优化等等.本系列重在描述基本概念,并不在应用的方面的做深入的探讨, ...

  6. 程序员的数学 2 概率统计pdf

    下载地址: 网盘下载 内容简介  · · · · · · 本书沿袭<程序员的数学>平易近人的风格,用通俗的语言和具体的图表深入讲解程序员必须掌握的各类概率统计知识,例证丰富,讲解明晰,且提 ...

  7. 统计思维:程序员数学之概率统计(第2版):第1章 探索性数据分析

    第1章 探索性数据分析 如果能将数据与实际方法相结合,就可以在存在不确定性时解答问题并指导决策,这就是本书的主题. 举个例子.我的妻子在怀第一胎时,我听到了一个问题:第一胎是不是经常晚于预产期出生?下 ...

  8. 读书笔记:程序员的数学 概率统计

    读书笔记:程序员的数学 概率统计 特点 内容 第一.二章 概率定义 多随机变量 第三.四章 离散.连续分布 第五章 协方差矩阵与多元正态分布 第六.七章 估计与检验 伪随机数 第八章 各类应用 体会 ...

  9. 概率图与随机过程:概率统计基本概念与人工智能应用之间的桥梁

    在机器学习算法的修炼道路中,概率图模型和随机过程对很多同学而言是一个巨大的拦路虎.很多同学会有这样一种感觉:这里面所涉及的模型概念可是真多啊!三两下就给整蒙了: 概率模型.图模型还没整明白,又来了个概 ...

最新文章

  1. 谷歌升级Android分析应用程序
  2. python 高斯烟羽模型_GPR(高斯过程回归)详细推导
  3. 干货 | OneAPM研发总监高海强:百万并发云压测平台的关键技术
  4. python编写个人信息_1、纯python编写学生信息管理系统
  5. 循环双链表的手动构建总结
  6. Mesos超配:让集群利用率可以达到100%
  7. 《python 编程从入门到实践》变量
  8. java实现图片与base64转换
  9. C#:实现敏感词过滤算法(附完整源码)
  10. c语言编程悬臂梁受力分析,悬臂梁受力的分析.doc
  11. c#winfrom通讯录管理系统
  12. python爬取天天基金网_Python爬虫日记二:爬取天天基金网
  13. 新浪微博短网址t.cn 短链接生成9.28
  14. 主分区损坏diskgenius_Diskgenius硬盘分区表坏了不要紧 用软件三步就能修复
  15. 广播电台常用51首背景音乐~甘醇永久
  16. 小新air15一键还原后,单击鼠标右键一直转圈
  17. 新浪天气预报代码及城市代码
  18. BUUCTF RE WP31-32 [WUSTCTF2020]level1、[GWCTF 2019]xxor
  19. linux qemu-nbd介绍
  20. 办理公司经营贷款需要什么条件呢?-民兴商学院

热门文章

  1. JSON压缩算法:CJSON和HPack
  2. 数据结构学习之单链表
  3. iconfont 图标宽高出问题_阿里巴巴Iconfont加入部分图标后导致所有图标高度拉升问题...
  4. element-table表格内换行
  5. 【CV】鱼眼相机模型与畸变矫正(Fisheye Camera Model Calibration)
  6. Laya Event
  7. EF CodeFirst下,当实体结构发生修改怎么更新数据库结构
  8. 小红书2023春招算法笔试题 - K排序
  9. vi/vim编辑器语法的操作
  10. 持续丰富营销玩法 东风标致408X引领品牌向上焕新