统计学合称为“概率统计”,但显然这两者是有关系,但不是同一的,那么二者的关系究竟是什么呢?

简单来说,概率论研究的是“是什么”的问题,统计学研究的是‘怎么办“的问题。
统计学不必然用到概率论,比如用样本均值来表征总体某种特征的大致水平,这个和概率就没有关系。
但是因为概率论研究的对象是随机现象,而统计学恰恰充满了无处不在的随机现象:因为要随机抽样。因此概率论就成为了精确刻画统计工具的不二法门

Lary Wasserman 在 All of Statistics 的序言里有说过概率论和统计推断的区别,相对于上面的图,更加透彻:

The basic problem that we study in probability is:
Given a data generating process, what are the properities of the outcomes?
...
The basic problem of statistical inference is the inverse of probability:
Given the outcomes, what can we say about the process that generated the data?

概率论是统计推断的基础,在给定数据生成过程下观测、研究数据的性质;而统计推断则根据观测的数据,反向思考其数据生成过程。预测、分类、聚类、估计等,都是统计推断的特殊形式,强调对于数据生成过程的研究。

统计和概率是方法论上的区别,一个是推理,一个是归纳。

打个比方,概率论研究的是一个白箱子,你知道这个箱子的构造(里面有几个红球、几个白球,也就是所谓的分布函数),然后计算下一个摸出来的球是红球的概率。而统计学面对的是一个黑箱子,你只看得到每次摸出来的是红球还是白球,然后需要猜测这个黑箱子的内部结构,例如红球和白球的比例是多少?(参数估计)能不能认为红球40%,白球60%?(假设检验)

而概率论中的许多定理与结论,如大数定理、中心极限定理等保证了统计推断的合理性。做统计推断一般都需要对那个黑箱子做各种各样的假设,这些假设都是概率模型,统计推断实际上就是在估计这些模型的参数。

概率论是统计学的基石。
统计学是从旧时的赌博来的。当时的赌徒们通过历史数据的记录,逐渐总结出了描述性统计。利用这些描述性统计的数据,使得他们胜率直线上升。哪个有赚哪个稳赔,哪个波动大没规律,这些经验逐渐成为了知识,并在之后的各个领域里体现了这种智慧。
赌博中的统计,就是要用以往的胜败估计下一次成功的大小。为什么能够这样做,为什么以往的数据能对下一次数据有较为准确的估计,这是概率论要说清楚的。大数定律的三个定理就是要说明为什么样本均值可以估计总体均值。这个估计的准确性却是要由统计学说的,对于各种分布的参数估计,之后的模拟估测,虽然与概率论看似完全无关,实际上却是由他们在支撑着统计学这个科目。这个情况对于参数统计,非参数统计,半参数统计,都是一样的。
总结起来,一个是对原理的讨论,一个是对方法的讨论。

1.概率論是數學分支,統計不是。
2.學概率要有很好的數學基礎(測度論,實變函數論),統計不然。
3.在學統計的人眼中,研究概率和研究純數學一樣。在學概率的人眼中,統計和數學沒太大關係和工科一樣。

概率论是由概率分布推断样本性质,如大数定律、中心极限定理。
统计是由样本信息反推概率分布,如概率分布参数的点估计、区间估计,以及线性回归。

在现实中二者结合很紧密。通过样本训练出概率分布,相当于老师不断教学生知识(样本),让学生大脑形成当前对象的模型;在学生学会了之后,就相当于这个模型(概率分布)成型了,就可以自己去推导、产生知识(样本)。

概率论就好比是给你一个模型,你可以知道这个模型会产生什么样的数据;而统计则是给你一些数据,你来判断是由什么样的模型产生的。

再从小概率事件看看两者的关系:概率论会说小概率事件必然发生。因为随着试验次数的增多,该事件会发生的期望np终会大于1。统计则倾向于忽略小概率事件或者认为小概率事件不会发生。例如MLE提供了最大似然估计,估计是一个以假设值代替真实值的过程,这个过程一个自然的思想便是认为小概率不会发生,所以我们有充足的理由认为估计是可接受的。

从源头谈一谈吧:

统计学有两个源头,概率论和国情学。

16世纪,概率论的体系渐渐发展起来,而这要从一种和掷骰子有关的赌博活动说起。虽然这个起源并不是很光彩,而且有待考证,但是在欧洲兴起并兴盛的骰子赌博活动,引起了一批好奇的学者的关注。掷骰子得到的点数直接决定赌局的输赢,于是开始研究各种点数出现的机遇的大小,胜率的大小,最早开始数量研究并且给概率下定义的学者已经无从考证了,可是有一些著作的问世和问题的讨论对概率统计的发展产生了重大的影响,比如卡丹诺的《机遇博弈》、惠更斯的《机遇的规律》 、伯努利的《推测数》 、著名的分赌本问题、帕斯卡和费马之间的通信,在这期间,古典概型得到了极大的发展,概率、期望、二项分布、中心极限定理等概念被相继提出。

统计学的英文是“statistic”,其实它是源于意大利文的“stato”,意思是“国家”、“情况”,也就是后来英语里的state(国家),在十七、十八世纪,统计学很多时候都是以国情学的姿态出现的。而且很长一段时间,都是在研究人口统计,尤其是生男生女的比例问题。概率论和国情学的融合,统计学渐渐发展也是从这开始。在这期间时,一些重要的理论被发现,二项分布和大数定律。根据二项分布建立了统计推断的最早的模型而且,而且对此分布中未知概率的研究也成为贝叶斯学派的思想起源。而之后的几百年里,中心极限定理的渐渐完善的过程中,一系列的统计量相继被提出,这也构成了大样本方法的基础。

概率论是统计学的基础,统计学是概率论的发展,二者密不可分。

概率论与统计学的关系是什么?相关推荐

  1. 人工智能中的概率论与统计学修炼秘籍之著名教材

    概率论与统计学的学习者众多,为了迎合不同学习者的需求,各种教材种类繁多.眼花缭乱.为此,非常有必要推荐一些常用的教材给人工智能学习人员,提升学习的效率,提高学习的效果.根据学习逐渐深入的顺序,本文将按 ...

  2. 【原理】极大似然法(MLE)——概率论在统计学的应用

    极大似然法(MLE) 求最大似然函数估计值的一般步骤: (1)写出似然函数: (2)对似然函数取对数,并整理: (3)求导数,令导数为0,得到似然方程: (4)解似然方程,得到的参数即为所求: 举例 ...

  3. 数学基础(高数、线代、概率论、统计学等等)

    此文章只作为个人学习笔记,不会面面俱到,完整学习还请多看看书和视频吧,个人理解如果有错误希望指出,共同学习进步. 机器学习 高数.线代和概率论是黄海广博士的知乎帖子,只是做总结,具体知识点参考课本和视 ...

  4. 【概率论与统计学】最常用常考的6种概率计算 经验分享

    本文介绍在概率论与数理统计,统计学这两门课中,以及平时的作业中最常用的两种需要加以应用的六种概率.按照数据的类型可以分为两类,一类是针对连续型变量(均匀分布.指数分布.正态分布),另一类则针对离散型变 ...

  5. 【统计学习】概率论与统计学基础

    (1)统计及应用领域 (2)数据.预处理.图表 (3)概括性度量 1)集中趋势 2)离散趋势 3)偏态与峰态 (4)概率与概率分布 随机变量.随机事件 期望.方差 概率分布.概率密度分布 (5)统计量 ...

  6. 概率论与统计学(2)

    古典概型: 样本方差VS总体方差 试验 VS 随机试验 样本空间:所有可能结果的集合,简称为S 样本点:S中的每一种情况,简称为E 随机事件:样本点 基本事件:一个样本点的单点集 事件发生 必然事件 ...

  7. 数据分析面试【概率论与统计学】总结之-----统计学常见面试题整理

    阅读之前看这里

  8. 机器学习之概率论与数理统计基础知识-(2)随机变量和数字特征

    该博客是根据百度贴吧利_刃网友的内容进行整理的,原出处请点击此处! 2.1 统计学(Statistic) 统计学是通过搜索.整理.分析数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性 ...

  9. 统计学元知识(从一到全部)

    1.什么是统计学 原始理解:通过样本去估计总体,无论是点/区间估计.假设检验.方差分析还是线性回归. 样本 → 总体  课本定义: ①一门 收集分析.表述和解释数据的科学. ②一组方法,用来设计实验. ...

最新文章

  1. Android 获取标题栏的高度
  2. java中的CAS和原子类的实现
  3. 查询中接受的主体参数_Apollo入门引导(三):编写查询解析器
  4. 在向服务器发送请求时发生传输级错误。
  5. docker自动部署脚本
  6. MySQL-8.0.11-winx64.zip安装教程(Win10操作系统)
  7. Enhancing Diversity in Teacher-Student Networks via Asymmetric branches for Unsupervised reid论文解读
  8. 生活之一米之外就是阳光
  9. 使用RecyclerView实现列表展开动画
  10. 设置计算机访问权限密码忘了怎么办,苹果访问限制密码是什么?忘记怎么办【详解】...
  11. 读书: 枪炮、病菌与钢铁
  12. 数据分析找不到数据?200个源数据网站全给你!
  13. 黑客攻防技术宝典Web实战篇(第二版)_读书笔记(第一章~第三章)
  14. cisco服务器网关自动清空,监控、重置和删除Cisco CallManager的MGCP网关
  15. 数值分析--matlab迭代求根式
  16. 【转】用户管理模块:如何保证用户数据安全?
  17. php如何平铺背景图片,css如何让背景图片平铺?css背景图片平铺四种方式介绍
  18. c语言 floyd优化,Floyd(弗洛伊德)算法(C语言)
  19. Android中添加Options Menu,按MENU键无反应
  20. [java] 分布式id生成方案

热门文章

  1. java 微信服务器录音下载到自己服务器,并转为wav格式
  2. 全景虚拟漫游技术实现(three.js vs ThingJS) Javascript 3D开发 前端 物联网 webgl 三维建模 3D模型 虚拟 全景
  3. 前端jQuery获取当前日期及前一周或者后一周的日期
  4. 假期作业二:主成分分析:步骤、应用及代码实现。代码可以用任何你熟悉的编程语言。
  5. 双系统下Ubuntu20.04使用Pavucontrol无法连接pulseaudio解决办法
  6. 阿里云RPA操作——当前窗口截图
  7. Oracle中SCOTT用户的 emp、dept、bonus、salgrade表的意思及其属性的意思
  8. Excel中提取各sheet名
  9. 作业~嗖嗖移动业务大厅
  10. 1104 Path In Zigzag Labelled Binary Tree