文章福利:Python学习精选书籍10本


统计、概率傻傻分不清?其实从下图中就应该知道概率、统计是有区别的

本话题主要是为了后续讨论与理解最大似然估计(MLE)、最大后验概率估计(MAP)贝叶斯公式做基础。本篇我们只讨论概率与统计之间的区别。

为了更通俗的理解,先来讨论统计,为什么呢?因为概率可以理解为在统计基础上衍生出来的。


什么是统计(statistics)

先来看个问题:有一种动物,请问这是什么动物(答案唯一)?

这...没人能猜得对吧。我也猜不出来,即便是天王老子来了也猜不出来。加个条件,它一天24小时只干两件事(干饭、睡觉),请问这是什么动物?

咦,这不是你女朋友么?(开玩笑)

嘘,别瞎猜,要不然狗命不保。


那么再加些条件:四条腿、还会哼哼哼的叫,鼻子长长的,有的还可以当宠物。

嗯,模型基本可以确定了,对,就是他

我们仔细想想这个过程,你是怎么猜出它来的。

我们有一堆数据,动物、四条腿、鼻子(长长的)、叫声(哼哼哼)、行为(干饭、睡觉),通过判断与观察这些数据,大伙一致的认为并且确定这个模型是猪。

这个游戏和统计有什么关系呢?在实际的统计研究中,我们也是通过观察数据来初步推测模型的。

就像文章 建立回归模型的完整步骤 中提到的,我们通过数据的散点图走势分布来判断是否使用线性回归模型,当然通过数据还可以判断出其他分布模型:像指数分布、高斯分布、拉普拉斯分布。

当然,如果上述游戏的模型参数、数据量再给多点我们甚至可以研究归纳出:判定猪的品种模型,究竟是圈养猪呢还是松辽黑猪呢还是乌克兰小乳猪。

(此模型只做演示说明使用,并非真正的模型)

其中,y 是猪的种类,x1为产地 ,x2为大小,x3为可爱程度...

再举一个更加实际的栗子:当我们去医院看病的时候,医生通过询问你的症状(饮食、不良行为....)来判断归纳(建立病症模型)出什么病,最后才对症下药。

以上案例都是建立在人们熟知的模型上去做判断,若是一种新的物种、病情呢?通过数据无法从已有模型中挑选出对应模型怎么办,这个时候就进入了统计的原始阶段,需要大量数据、案例做支撑,然后发明一个新的模型,不断演化直到成熟被公认。

一句话总结:统计是在已知数据的前提下,进行模型的归纳与推断。


什么是概率(probabilty)

概率研究的问题恰好与统计相反,概率是在已知模型的基础上去预测这个模型产生的结果(方差、均值等)。如:现在我们有一个已知模型(判断猪的种类模型)

其中,y 是猪的种类,x1为产地, x2为大小 ,x3为可爱程度,....

故事线:现在有一个人在山间上发现一只猪,但又不确定是什么猪,万一是只野猪(凶猛)那就不好了,正巧他想起外甥是养猪协会的,他急忙给外甥打电话,并告知外甥这个猪的一些特征,balabala.....,外甥经过他多年悦猪无数的职场经验(脑海已模型自现),立马就判断出这只猪的品种,原来是只乌克兰小乳猪啊,很可爱不用担心,真是虚惊一场。

这个过程我们可以简化为:通过种类模型我们预测出来了符合条件的样本数据(猪的特征)属于哪一种猪 【极大概率上】

注:对于已成熟的模型(已通过模型有效性检验:R方、F检验)预测结果在极大概率上是可靠的。

一句话总结:概率是在已知模型的基础上,对其他样本数据进行预测。


还记得在讨论回归话题时的这幅图么

在统计学里,任一现存的技术手段都是经历了统计与概率的考验才留下来,最终形成一个闭环(仅个人见解)。


最后借用专家的话来解释总结下:

Lary Wasserman 在 《All of Statistics》 的序言里有说过概率论和统计推断的区别:


大意:

统计学:根据手中信息,猜猜桶里有啥?(样本归纳总结出总体)

概率论:根据桶中信息,猜猜手里有啥?(总体对样本进行预测)

更多精彩内容请关注 公众号:数据与编程之美

原文地址:概率和统计是一回事么?

概率和统计是一回事么?相关推荐

  1. 概率和统计的matlab指令

    1.描述性统计分析 描述性统计分析函数标准用法都是对列状数据进行操作. mean(X):当X为向量,返回向量的均值:当X为矩阵,返回矩阵的每列元素均值构成的行向量.  min,max,sort,mea ...

  2. 免费机器学习课程爆红:从概率与统计到全栈深度学习,英伟达工程师小姐姐整理...

    乾明 发自 凹非寺  量子位 报道 | 公众号 QbitAI 有一份适合按顺序依次学习的免费机器学习资源,在Twitter上火了. 一天之间便获得5.9K点赞和1.5K转发. 评论区中,"T ...

  3. 机器学习基础-概率和统计基本概念

    记录概率和统计相关的概念和基础知识 总体来说 概率和统计是互逆的: 概率根据数据生成的过程进行建模,研究某种模型产生的数据有什么特性, 统计学正好相反,通过已知的数据,来推导产生这些数据的模型是怎样的 ...

  4. 辨异 —— 概率与统计

    样本矩阵的每一个属性列均可从分布的角度观察,也即每一个属性列的全部样本在该属性上的值均可从该分布获得: 1. 概率 vs 统计 概率:由总体(population)得样本的性质: 统计:由抽样得到的样 ...

  5. 人工智能数学基础--概率与统计7:学习中一些术语的称呼或表示变化说明以及独立事件的一些补充推论

    一.概念表示变化说明 笔者最开始学习概率论时,是以美版M.R.斯皮格尔等著作的<概率与统计>作为教材学习,学习过程中发现部分内容理解困难,之所以这样,一是这本书的内容太古老,教材是2002 ...

  6. 笔试题:一只青蛙一次可以跳上1级台阶,也可以跳上2级台阶。求该青蛙跳上一个 n 级的台阶总共有多少种跳法。该题有三种解法:递归的方法求解斐波那契数列、用概率与统计的数学方法解决,3.动态规划

    笔试题 一只青蛙一次可以跳上1级台阶,也可以跳上2级台阶.求该青蛙跳上一个 n 级的台阶总共有多少种跳法.该题有三种解法:1.递归的方法求解斐波那契数列.2.用概率与统计的数学方法解决,3.动态规划 ...

  7. [肖博数学干货]高考数学二轮复习方法之概率和统计附强化题型解析

    高考数学二轮复习方法之概率和统计的解答题是每年高考必考的内容,概率与统计的计算.线性回归分析与统计案例的计算等内容都是考查实践能力的良好素材.本部分用到的思想方法主要有:分类讨论的思想方法.转化与化归 ...

  8. matlab中unifrnd函数用法,概率和统计的MATLAB指令

    1.描述性统计分析 描述性统计分析函数标准用法都是对列状数据进行操作. meam(X):当X为向量,返回向量的均值:当X为矩阵,返回矩阵的每列元素均值构成的行向量.min,max,sort,mean, ...

  9. 图解AI数学基础(2) | 概率与统计(要点速查清单·完结)

    作者:韩信子@ShowMeAI 教程地址:https://www.showmeai.tech/tutorials/83 本文地址:https://www.showmeai.tech/article-d ...

最新文章

  1. 文档相似度之doc2vec、文档聚类
  2. 水壶问题 算法导论8.4
  3. radio button html5,Tkinter Radiobutton单选框的用法
  4. 浅谈嵌入式软件的未来发展
  5. 2015 ACM/ICPC Asia Regional Changchun Online题解
  6. XML解析模型(完整版)
  7. GM505高斯计使用方法图解
  8. 计算机毕业设计Java-ssm博物馆交流平台源码+系统+数据库+lw文档
  9. 计算机技术对高分子的意义,计算机技术在高分子材料工程中的应用.docx
  10. win10找不到网络里的计算机,Win10专业版找不到网络中的其他电脑
  11. [开发过程]<项目管理>TAPD工具
  12. 68 个 Python 内置函数详解,初学者一定不要错过,建意收藏学习
  13. 【每日英语】英语语法
  14. pytorch--初识张量与常见基础函数(1)
  15. 白狐微信公众号编辑器CMS系统源码
  16. Vue项目首页-开发周末游组件(7-7)
  17. 设置图表标题、坐标轴标题及窗口标题
  18. 【Havel 定理】Degree Sequence of Graph G
  19. 全班抽签java程序
  20. 谷粒商城2-环境安装

热门文章

  1. 树莓派3B+神经计算棒实时人脸追踪机器眼
  2. Consolas-with-Yahei
  3. r语言平均值显著性检验_R语言入门:检验相关性的显著性
  4. 【重识云原生】第六章容器基础6.4.5.3节——Deployment实现原理解析
  5. k8s pod 详解
  6. 用java实现鹰眼导航_关于MapXtreme for Java鹰眼实现思路及代码
  7. 使用audacity生成单声道音频
  8. P6软件如何设置权重体系
  9. 正版示波器软件安装教程NS-Scope
  10. 游戏平台系统云游戏实现