对于统计学只是皮毛认识,在学校时根本不重视,如今机器学习几乎以统计学为基础发展起来的,头疼的紧,如今还得琢磨基础概念。

1、我自己的理解:

1)先验:统计历史上的经验而知当下发生的概率;

2)后验:当下由因及果的概率;

2、网上有个例子说的透彻:

1)先验——根据若干年的统计(经验)或者气候(常识),某地方下雨的概率;

2)似然——下雨(果)的时候有乌云(因/证据/观察的数据)的概率,即已经有了果,对证据发生的可能性描述;

3)后验——根据天上有乌云(原因或者证据/观察数据),下雨(结果)的概率;

后验 ~ 先验*似然 : 存在下雨的可能(先验),下雨之前会有乌云(似然)~ 通过现在有乌云推断下雨概率(后验);

3、再来一例:

先验概率可理解为统计概率,后验概率可理解为条件概率。

------------------------------------------------------------------
设定背景:酒至半酣,忽阴云漠漠,骤雨将至。

情景一:
“天不会下雨的,历史上这里下雨的概率是20%”----先验概率
“但阴云漠漠时,下雨的概率是80%”----后验概率

情景二:
“飞飞别急着走啊,历史上酒桌上死人的概率只有5%“----先验概率
”可他是曹操啊,梦里都杀人“----后验概率

4、吃瓜群众的例子

用“瓜熟蒂落”这个因果例子,从概率(probability)的角度说一下,

先验概率,就是常识、经验所透露出的“因”的概率,即瓜熟的概率。应该很清楚。

后验概率,就是在知道“果”之后,去推测“因”的概率,也就是说,如果已经知道瓜蒂脱落,那么瓜熟的概率是多少。后验和先验的关系可以通过贝叶斯公式来求。也就是:

P(瓜熟 | 已知蒂落)=P(瓜熟)×P(蒂落 | 瓜熟)/ P(蒂落)

似然函数,是根据已知结果去推测固有性质的可能性(likelihood),是对固有性质的拟合程度,所以不能称为概率。在这里就是说,不要管什么瓜熟的概率,只care瓜熟与蒂落的关系。如果蒂落了,那么对瓜熟这一属性的拟合程度有多大。似然函数,一般写成L(瓜熟 | 已知蒂落),和后验概率非常像,区别在于似然函数把瓜熟看成一个肯定存在的属性,而后验概率把瓜熟看成一个随机变量。

---

再扯一扯似然函数和条件概率的关系。似然函数就是条件概率的逆反。意为:

L(瓜熟 | 已知蒂落)= C × P(蒂落 | 瓜熟),C是常数。具体来说,现在有1000个瓜熟了,落了800个,那条件概率是0.8。那我也可以说,这1000个瓜都熟的可能性是0.8C。

注意,之所以加个常数项,是因为似然函数的具体值没有意义,只有看它的相对大小或者两个似然值的比率才有意义,后面还有例子。

----------------------------------------------------------------------------------------------------

同理,如果理解上面的意义,分布就是一“串”概率。

先验分布:现在常识不但告诉我们瓜熟的概率,也说明了瓜青、瓜烂的概率

后验分布:在知道蒂落之后,瓜青、瓜熟、瓜烂的概率都是多少

似然函数:在知道蒂落的情形下,如果以瓜青为必然属性,它的可能性是多少?如果以瓜熟为必然属性,它的可能性是多少?如果以瓜烂为必然属性,它的可能性是多少?似然函数不是分布,只是对上述三种情形下各自的可能性描述。

那么我们把这三者结合起来,就可以得到:后验分布 正比于 先验分布 × 似然函数。先验就是设定一种情形,似然就是看这种情形下发生的可能性,两者合起来就是后验的概率。

至于似然估计

就是不管先验和后验那一套,只看似然函数,现在蒂落了,可能有瓜青、瓜熟、瓜烂,这三种情况都有个似然值(L(瓜青):0.6、L(瓜熟):0.8、L(瓜烂):0.7),我们采用最大的那个,即瓜熟,这个时候假定瓜熟为必然属性是最有可能的。

5、分布解:

先验分布:根据一般的经验认为随机变量应该满足的分布
后验分布:通过当前训练数据修正的随机变量的分布,比先验分布更符合当前数据
似然估计:已知训练数据,给定了模型,通过让似然性极大化估计模型参数的一种方法
后验分布往往是基于先验分布和极大似然估计计算出来的。

机器学习知识点(二十七)先验概率和后验概率理解相关推荐

  1. 机器学习:浅谈先验概率,后验概率

    机器学习:浅谈先验概率,后验概率 在学习贝叶斯网络模型的时候,接触到好多比较麻烦的概念,今天又复习了一下,就写一下笔记,用来巩固一下. 主题模型LDA算法是自PLSA之后一个重大提升.PLSA的mod ...

  2. 机器学习知识点(二十八)Beta分布和Dirichlet分布理解

    1.二者关系: Dirichlet分布是Beta分布的多元推广.Beta分布是二项式分布的共轭分布,Dirichlet分布是多项式分布的共轭分布. 通常情况下,我们说的分布都是关于某个参数的函数,把对 ...

  3. 先验概率和后验概率理解

    对于统计学只是皮毛认识,在学校时根本不重视,如今机器学习几乎以统计学为基础发展起来的,头疼的紧,如今还得琢磨基础概念. 1.我自己的理解: 1)先验:统计历史上的经验而知当下发生的概率: 2)后验:当 ...

  4. 机器学习知识点(三十七)特征选择方法总结

    在模型训练中,特征选择是非常重要.样本有限的情况,特征过多计算开销过大:通过特征选择去掉冗余和不相关特征,可提高模型性能降低计算开销.两个字:降维.当然降维后,模型性能应该是提升的.特征选择的最终目的 ...

  5. (转载)机器学习知识点(二十九)LDA入门级学习笔记

    入门级学习笔记 1.1文本建模相关 统计文本建模的目的其实很简单:就是估算一组参数,这组参数使得整个语料库出现的概率最大.这是很简单的极大似然的思想了,就是认为观测到的样本的概率是最大的. 建模的目标 ...

  6. 机器学习知识点(二十三)黎曼流形认知

    对于流形,我在机器学习中的认识就是局部欧式距离的应用,当然其背后强大的数学逻辑也不是一时可以窥全貌,只好先看看一些基础概念. 1.基本概念 流形,是局部具有欧几里得空间性质的空间,是欧几里得空间中的曲 ...

  7. 机器学习知识点(二十六)概率图模型条件随机场CRF

    1.先看概率图模型谱系,有其是MFR和CRF的关系: 这个图源自经典的文章<An Introduction to Conditional Random Fields> 地址:http:// ...

  8. 机器学习知识点(二十四)隐马尔可夫模型HMM维特比Viterbi算法Java实现

    1.隐马尔可夫模型HMM    学习算法,看中文不如看英文,中文喜欢描述的很高深.    http://www.comp.leeds.ac.uk/roger/HiddenMarkovModels/ht ...

  9. 机器学习知识点(二十一)特征选择之岭回归和LASSO

    特征选择,也就是特征缩减,是通过对损失函数(即优化目标)加入惩罚项,使得训练求解参数过程中会考虑到系数的大小,通过设置缩减系数(惩罚系数),会使得影响较小的特征的系数衰减到0,只保留重要的特征.嵌入式 ...

最新文章

  1. 为了节省能量,人类演化出了“不合规律”的大脑神经元 | Nature
  2. (剑指Offer)面试题10:二进制中1的个数
  3. 实地址模式与保护模式下的中断与异常处理
  4. (chap6 Http首部) 请求首部字段 Acceptx-Charsetx-Encodingxx-Language
  5. 互联网分布式架构技术概述
  6. pythondistutils安装_安装msi后的python distutils
  7. why is the configuration.js being loaded?
  8. python中的命名空间指什么_python中命名空间
  9. 模式识别中常见概率符号公式的学习笔记 By Youki~
  10. 封条格式用word怎么打_封条格式用word怎么打
  11. Android第五十二期 - 云之讯的代码混淆
  12. PHP 日期 加减 月数,天数,周数,小时,分,秒等等
  13. 初识flume-介绍
  14. 2022年道路运输企业安全生产管理人员考试及道路运输企业安全生产管理人员新版试题
  15. 2018高中计算机竞赛,最新 | 2018年高中生各项竞赛时间一览表
  16. 2021年HSP律所代理品牌侵权案件合集,赶紧查看避免踩坑
  17. wps怎么画网络图_wps 流程图怎么画 WPS流程图绘制图解教程
  18. vue项目中引入Luckysheet
  19. Python中的psutil:一个用于获得处理器和系统相关信息的模块
  20. 完全二叉树的每层权值

热门文章

  1. ubuntu python3.5安装_ubuntu16.04升级Python3.5到Python3.7的方法步骤
  2. 8086之8253芯片仿真
  3. matplotlib----初探------4折线图
  4. 要有被打断仍能够继续学习的能力
  5. JNI错误记录--JNI程序调用本地库时JVM崩溃
  6. RHEL(RedHat Enterprise Linux)5/6 ISO镜像下载
  7. 华表 单元格公式设定与计算
  8. USB学习5---android usb驱动源代码目录说明
  9. codelite14中文语言包_Windows下CodeLite完美支持中文的正确设置方法
  10. java B2B2C Springcloud电子商城系统-通过消息队列传输zipkin日志