文章目录

  • 一、统计学基础知识
    • 1.总体和样本
    • 2.均值
    • 3.方差和标准差
    • 4.随机变量
    • 5.概率密度函数
  • 二、二项分布
  • 三、泊松分布
  • 四、大数定理
  • 五、正态分布
    • 1.正态分布的一些含义
    • 2.如何求解正态概率

一、统计学基础知识

1.总体和样本

统计学上的总体值得是准备对其进行测量、研究或分析的整个群体,可以是人、得分,也可以是糖果——关键在于总体指的是所有对象。一个统计样本就是从总体中选取的一部分对象。通过选取样本,使其恰当地代表总体,从而得到代表总体的一个子集。对于糖果公司曼帝糖果来说,一个口香糖球样本就是所选取的一小部分糖球,而不是每一粒糖球。

2.均值

均值:平均数的一般度量。平均数是量度数据集中趋势的一种方法。均值和平均数不就一回事吗?为什么还说均值是平均数的一般度量?可能以前有人让你计算过平均数。计算大量数据的平均数的一个方法是:将所有的数字加起来,然后除以数字个数。在统计学中,这样算出来的值叫做均值。而且平均数不止一种。如果你得知了某个数据集的平均数同时也知道了该平均数的种类,那么你将更好地理解这个数据集的真实情况。平均数的种类有:算术平均数、调和平均数以及集合平均数等。

第一种就是上面提到的将所有的数字加起来,然后除以数字个数所得到的均值;第二种均值则是考虑了每个数字出现的频数,频数用f表示。

3.方差和标准差

方差:是量度数据分散性的一种方法,是数值与均值的距离的平方数的平均值。标准差:方差的平方根。在量度数据的分散性上,标准差比方差更加直观,因为标准差能根据与均值的距离指出分散性,而方差是与均值根据距离的平方来指出数据的分散性。

4.随机变量

随机变量似乎也是变量的一种,它和传统变量有什么区别吗?传统变量是可求解变量,例如x+3=7,我们可以求得变量x的值为4。而随机变量虽然也可以取很多值,但这些变量无法求解,只能通过计算得出取某个值的概率。但要注意,随机不是随便,随机变量只能从某个固定范围内取值。随机变量通常用大写字母(如X)表示,这应该也是为了和可求解的传统变量区分开。随机变量与其说是一种变量,倒不如说它是一种函数,一种将随机过程映射到实际数值的函数,一种将随机过程量化的函数。假设我们需要量化一个随机过程:比如明天是否下雨,该过程可量化为:

其中X就是一个随机变量,它的取值是随机的,因为我们不确定明天是否下雨,但它的值只能从0和1当中选一个。当然也可以用其他数值来表示下不下雨,比如100,21等,这取决于你的需要。随机变量分为离散型随机变量和连续型随机变量,前者的取值是在整数范围内,后者的取值是在实数范围内。

5.概率密度函数

概率密度函数用于描述连续型随机变量的概率分布。概率密度函数f(x)是这样一种函数:通过它可以求出一个数据范围内的某个连续变量的概率,它向我们指出该概率分布的形状。如图就是一个概率密度函数的图形。

概率密度函数有以下性质:

二、二项分布

二项分布描述的是离散型的随机变量。二项分布包括以下条件:
(1)你正在进行一系列独立试验。
(2)每一次试验都存在失败和成功的可能,每一次试验成功概率相同。
(3)试验次数有限。假如在我们要进行一系列独立试验,每一次试验结果或成功或失败,成功概率为p,失败概率为q,且p+q=1。我们感兴趣的是这一系列试验中最终获得成功的次数。用X表示“n次试验中成功次数”,为了求得r次成功的概率,可用下列算式:

三、泊松分布

泊松分布描述的是离散型的随机变量。泊松分布包括以下条件:
(1)单独事件在给定区间内随机、独立地发生,给定区间可以是时间或空间,例如可以是一个星期,也可以是一英里。
(2)已知该区间内的事件平均发生次数(或者叫做发生率),且为有限数值。该事件平均发生次数通常用希腊字母表示。

四、大数定理

随着样本数的增加,样本均值将近似于真正的期望值,或者说样本均值将收敛于总体均值或随机变量期望值。

五、正态分布

1.正态分布的一些含义

正态分布之所以被称为正态,是因为它的形态看起来合乎理想。在现实生活中,遇到测量值之类的大量连续数据时,你“正常情况下”会期望看到这种形态。正态分布具有钟形曲线,曲线对称,中央部位的概率密度最大。越是偏离均值,概率密度越小。均值和中位数位于中央,具有最大概率密度。




2.如何求解正态概率

可以通过求解概率密度函数曲线下方的面积求出概率。如图:

求解概率三部曲:
(1)确定分布与范围:要确定分布的均值和方差以及需要求概率的那部分范围。(2)使其标准化:将普通的正态分布转化为标准正态分布。
(3)查找概率:一旦将正态分布转化为标准正态分布就可以通过查找正态分布的概率表来获取所求概率,因为概率表只给出了N(0,1)的概率。 当我们拿到一个确定的正态分布时,为便于求解概率需要将其标准化,通过下式可求出任何正态变量X的标准分:

当将X转化为标准正态变量时,就可以对照概率表查找相应的概率了。如下图所示:

参考资料:
《深入浅出统计学》
http://open.163.com/special/Khan/khstatistics.html 12-34集

统计学基础知识(一)相关推荐

  1. 统计学中p值计算公式_不得不学的统计学基础知识(二)

    接上一期的分享,今天继续学习统计学的相关知识,今天涉及到的五个知识点主要包括离散型概率分布.连续型概率分布.假设检验.假设检验的运用(一类错误与二类错误)以及相关.因果以及回归关系.楼主整理了网友们分 ...

  2. 统计学基础知识(三)

    假设检验 一.假设检验的一般流程 假设检验是统计推断的重要组成部分.下面从一个例子开始讲解假设检验.某公司声称他们发明了一种治疗打鼾的新药物鼾克,并断言能在两周内治愈90%的患者.某外科诊所的医生给病 ...

  3. 统计学基础知识梳理(三)

    假设检验 定义 假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法.其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是 ...

  4. 实例讲解统计学基础知识(4):参数估计

    作者:xxw9485 时间:2018/3/20 来源:https://www.jianshu.com/p/7e556f17021a 参数估计 统计学有两大主要分支,分别是描述性统计学和推断统计学.描述 ...

  5. 统计学基础知识note

    如何理解似然函数L(θ|D) 1.在学术上,通常用θ表示模型中的参数,用D表示数据.则参数的似然函数记为L(θ|D)=f(D|θ).值得注意的是,等式右边的P表示条件概率,等式左边的L虽然形式与右边相 ...

  6. 中心极限定理_统计学基础知识3——正态分布与大数定律、中心极限定理

    正态分布,也称常态分布,又名高斯分布. 正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线. 若随机变量X服从一个数学期望为μ.方差为σ^2的正态分布,记为N(μ,σ ...

  7. 统计学之基础知识(一)

    参考资料:可汗学院统计学.深入浅出统计学 统计学基础知识 1.平均数 平均值就是用数据之和除以数据的个数 2.方差 偏差=数据的数值-平均值 方差=[(偏差的平方)的合计]/(数据数) 3.标准差 标 ...

  8. 【入门】数据分析必备——统计学入门基础知识

    ↑↑↑关注后"星标"简说Python 人人都可以简单入门Python.爬虫.数据分析 简说Python推荐来源:木木自由 作者:小陌One old watch, like brie ...

  9. 数据分析必备——统计学入门基础知识

    数据说·梦想季 成功的关键在于相信自己有成功的能力.数据之路,与你同行!--数据说·梦想季 导读:要做好数据分析,除了自身技术硬以及数据思维灵活外,还得学会必备的统计学基础知识!因此,统计学是数据分析 ...

  10. 统计学基础理论学习(1)

    统计学基础知识 统计学基础知识知识点包括: 1. 数据的集中趋势 在统计学中,集中趋势又叫中央趋势,表示一个机率分布的中间值. 常见的几种表示集中趋势的计量包括算数平均数,中位数及众数. 数值平均数: ...

最新文章

  1. 这里天刚黑,而家里都已经后半夜了
  2. CentOS 7 解决丢失 nginx.pid
  3. a good approach to make demonstrations at the baidu netdisk
  4. C语言标识符的链接属性
  5. 0x13链表与邻接表之邻值查找
  6. hbase shell-dml(数据管理指令)
  7. Java EE 企业网站_基于jsp的企业网站系统-JavaEE实现企业网站系统 - java项目源码...
  8. 结构体定义小的放前面_编程C语言进阶篇——自定义数据类型:结构体
  9. 【100题】第三十六 比赛淘汰问题(谷歌笔试)
  10. 如何用计算机给机顶盒刷机,如何利用sd卡刷机 电视盒子通用刷机方法
  11. ANSYS中压电材料的参数分析
  12. 信息系统项目管理师论文写作技巧
  13. MeasureSpec介绍
  14. 微信公众号推送消息模板(抖音挺火的推送消息给女朋友)
  15. PostMan——安装使用教程(图文详解)
  16. 对接海康人脸识别api接口之PHP案例
  17. 架构实战体会,结合《蔡学镛:架构的5个观察角度》
  18. 实验二 (一) 大小写英文字母表
  19. java myeclipse的好处,关于MyEclipse_MyEclipse用途_MyEclipse优势
  20. 关于虚拟主机那点事儿

热门文章

  1. 使用Python编写获取QQ群成员昵称及号码的小工具
  2. 【李宏毅机器学习视频汇总】2016~2021李宏毅机器学习内容汇总及一些学习建议
  3. MQTT客户端程序的编写
  4. 2004-2020历年美赛优秀论文资源
  5. Python 脚本编写
  6. 扒一扒贝索斯的接班人,为何选他挑起大梁?
  7. Oracle Instant Client
  8. 针式打印机设置字号大小
  9. Linux php5 curl 扩展
  10. QQ空间权限限制破解思路