1. 贝叶斯定理

贝叶斯定理是关于随机事件 A 和 B 的条件概率:

其中P(A∣B)P(A|B)P(A∣B)是在 B 发生的情况下 A 发生的可能性。

  1. P(A)是 A 的先验概率,之所以称为“先验”是因为它不考虑任何 B 方面的因素。
  2. P(A|B)是已知 B 发生后 A 的条件概率,也由于得自 B 的取值而被称作 A 的后验概率。
  3. P(B|A)是已知 A 发生后 B 的条件概率,也由于得自 A 的取值而被称作 B 的后验概率。
  4. P(B)是 B 的先验概率,也作标淮化常量(normalizing constant)。

贝叶斯定理有一个好处就是可以根据新情况更新先验概率
举一个案例:

假设有两个各装了100个球的箱子,甲箱子中有70个红球,30个绿球,乙箱子中有30个红球,70个绿球。假设随机选择其中一个箱子,从中拿出一个球记下球色再放回原箱子,如此重复12次,记录得到8次红球,4次绿球。问题来了,你认为被选择的箱子是甲箱子的概率有多大?

下面容我来详细分析解答。刚开始选择甲乙两箱子的先验概率都是50%,因为是随机二选一(这是贝叶斯定理二选一的特殊形式)。即有:

P(甲) = 0.5, P(乙) = 1 - P(甲);

这时在拿出一个球是红球的情况下,我们就应该根据这个信息来更新选择的是甲箱子的先验概率:

P(甲|红球1) = P(红球|甲) × P(甲) / (P(红球|甲) × P(甲) + (P(红球|乙) × P(乙)))
P(红球|甲):甲箱子中拿到红球的概率
P(红球|乙):乙箱子中拿到红球的概率

因此在出现一个红球的情况下,选择的是甲箱子的先验概率就可被修正为:

P(甲|红球1) = 0.7 × 0.5 / (0.7 × 0.5 + 0.3 × 0.5) = 0.7

即在出现一个红球之后,甲乙箱子被选中的先验概率就被修正为:

P(甲) = 0.7, P(乙) = 1 - P(甲) = 0.3;

如此重复,直到经历8次红球修正(概率增加),4此绿球修正(概率减少)之后,选择的是甲箱子的概率为:96.7%。

2. 贝叶斯网络

一个贝叶斯网络定义包括一个有向无环图(DAG)和一个条件概率表集合。DAG中每一个节点表示一个随机变量,可以是可直接观测变量或隐藏变量,而有向边表示随机变量间的条件依赖;条件概率表中的每一个元素对应DAG中唯一的节点,存储此节点对于其所有直接前驱节点的联合条件概率。如下图所示:

贝叶斯网络有一条极为重要的性质,就是我们断言每一个节点在其直接前驱节点的值制定后,这个节点条件独立于其所有非直接前驱前辈节点。

这个性质很类似Markov过程。其实,贝叶斯网络可以看做是Markov链的非线性扩展。这条特性的重要意义在于明确了贝叶斯网络可以方便计算联合概率分布。一般情况先,多变量非独立联合条件概率分布有如下求取公式:

构造与训练贝叶斯网络分为以下两步:

1、确定随机变量间的拓扑关系,形成DAG。这一步通常需要领域专家完成,而想要建立一个好的拓扑结构,通常需要不断迭代和改进才可以。

2、训练贝叶斯网络。这一步也就是要完成条件概率表的构造,如果每个随机变量的值都是可以直接观察的,像我们上面的例子,那么这一步的训练是直观的,方法类似于朴素贝叶斯分类。但是通常贝叶斯网络的中存在隐藏变量节点,那么训练方法就是比较复杂,例如使用梯度下降法。

相关资料:
https://www.zhihu.com/question/28006799/answer/533797100
https://www.cnblogs.com/leoo2sk/archive/2010/09/18/bayes-network.html
https://blog.csdn.net/chasdmeng/article/details/38688525

3. 不确定性和置信度问题

不确定性度量反映的是一个随机变量的离散程度(dispersion)。换句话说,这是一个标量,反应了一个随机变量有多「随机」。在金融领域,这通常被称为「风险」。不确定性不是某种单一形式,因为衡量离散程度的方法有很多:标准差、方差、风险值(VaR)和熵都是合适的度量。总之要记住,「越高的不确定性」往往被视为「更糟糕」。

不确定性大概为两种:

偶然不确定性:这描述的是源自数据生成过程本身的随机性;不能简单地通过收集更多数据而消除的噪声。就像你不能预知结果的抛硬币。也许有人会想:因为偶然事件不确定性是不可约减的,所以我们对此无能无力,直接忽略它就好了。这可不行!在训练模型时,应该注意选择能够正确地代表偶然事件不确定性的输出表征。标准的 LSTM 不会得出概率分布,所以学习抛硬币的结果时只会收敛成均值。相对而言,用于语言生成的模型能够得出一系列类别分布(词或字符),这能纳入句子完成任务中的固有歧义性。

感知不确定性:与模型相关,是由于训练不完全导致的。如果给它更多的训练数据来弥补现有模型知识上的不足,这种不确定性从理论上来说是可以消除的。

nips2017的一篇论文用贝叶斯神经网络建模两类不确定性。

大部分不确定性估计算法都是基于Bayesian Neural Networks (可以理解为概率性的神经网络, 认为其参数服从一定的先验分布), 给定输入时就可以产生具有一定分布性质的输出用来计算模型不确定度

相关资料
https://www.cnblogs.com/sinoyou/p/11441634.html(基于贝叶斯网络的不确定性估计)
https://zhuanlan.zhihu.com/p/98756147(nips2017)
https://zhuanlan.zhihu.com/p/88654038(nips2017)
Dropout as a Bayesian Approximation: Representing Model Uncertainty in Deep Learning
Bayesian SegNet: Model Uncertainty in Deep Convolutional Encoder-Decoder Architectures for Scene Understanding

浅谈贝叶斯网络以及贝叶斯网络处理模型不确定性相关推荐

  1. 浅谈JAVA中如何利用socket进行网络编程(二)

    转自:http://developer.51cto.com/art/201106/268386.htm Socket是网络上运行的两个程序间双向通讯的一端,它既可以接受请求,也可以发送请求,利用它可以 ...

  2. 斗破苍穹文字页游php_浅谈斗破影视化下的网络文学二次创作

    笔者是一个网络文学爱好者,最开始接触这类文化是金庸先生笔下<神雕侠侣>的影视化作品.但是要说真正去接触文字作品的时间,是初三追连载小说<斗破苍穹>的时候. 在那之后的几年内,笔 ...

  3. 浅谈内存屏障,C++内存序与内存模型

    本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可. 本作品 (李兆龙 博文, 由 李兆龙 创作),由 李兆龙 确认,转载请注明版权. 文章目录 引言 一个有意思的问题 ...

  4. 【c++】26.浅谈“事件驱动”、select、poll、epoll

    浅谈"事件驱动" 1.通常,我们设计一个事件处理模型的程序有两种思路: 一种是通过轮询的方式; 一种通过事件驱动的方式,事件驱动方式也被称为消息通知方式. 下面举个简单收信的例子, ...

  5. web前端技术基础课程讲解之浅谈对soket的理解

    浅谈对soket的理解 定义: 网络上的两个程序通过一个双向的通信链实现数据的交换,这个链接的一端就成为Socket 它是进程通信的一种,即调用这个网络库的api函数实现分布在不同主机相关进程之间的数 ...

  6. 4计算机网络应用,浅谈计算机网络应用基础

    <浅谈计算机网络应用基础.doc>由会员分享,可免费在线阅读全文,更多与<浅谈计算机网络应用基础>相关文档资源请在帮帮文库(www.woc88.com)数亿文档库存里搜索. 1 ...

  7. linux cp mv区别,浅谈Linux下mv和cp命令的区别

    1.功能上的区别 mv:用户可以使用该命令为文件或目录重命名或将文件由一个目录移入另一个目录中. cp: 该命令的功能是将给出的文件或目录拷贝到另一文件或目录中. 2.从inode角度来区分 mv:会 ...

  8. 机器学习 —— 浅谈贝叶斯和MCMC

    ‍‍Abstract:最近课业内的任务不是很多,又临近暑假了,就在网上搜了一些有关于机器学习和深度学习的课程进行学习.网上的资料非常繁多,很难甄别,我也是货比三家进行学习.这是这个系列的第一个笔记,是 ...

  9. 浅谈频率学派和贝叶斯学派

    [写在前面的话] 终于可以写贝叶斯相关的文章啦,心情有点小激动,最近一段时间反复看Bishop老师编写的<<Pattern Recognition and Machine Learning ...

  10. 有关贝叶斯概率和贝叶斯网络和贝叶斯因果网络的自习笔记

    回校一周了,前段时间忙活着组会讨论班的事儿,然后安装了一个Ubuntu的双系统,暂时不想码代码先把一直好奇的贝叶斯网络了解下. 贝叶斯概率 首先是贝叶斯概率.贝叶斯作为泥腿子颠覆了前人"事件 ...

最新文章

  1. RepVGG:极简架构,SOTA性能,论文解读
  2. Kubernetes 日志收集的原理,看这一篇就够了
  3. LRNNet:轻量级FCB SVN实时语义分割
  4. IOS属性类型的讲解
  5. 以下选项不是python打开方式的是-模拟试卷 A
  6. 新鲜出炉!20款好看的英文字体下载
  7. Java对象序列化详解
  8. Web前端技术分享:img标签下方出现空隙的问题解决方案
  9. 第三次学JAVA再学不好就吃翔(part7)--基础语法之运算符
  10. OpenStack tokens id获取测试
  11. linux6如何分区,CentOS6.9安装 硬盘分区方案与分区步骤
  12. LD_LIBRARY_PATH should not contain the current directory
  13. python中进程创建—fork()
  14. 随笔_拉普拉斯变换的困惑点
  15. 北大青鸟python学费_北大青鸟学费贵吗,北大青鸟学费标准_北大青鸟综合校区为您解答...
  16. 《汉魏风云》2、孙吴兵法第一传人——辛苦的天才曹操
  17. 中国四大名著的文化价值
  18. Ubuntu kylin优麒麟下配置Hadoop环境
  19. 腾讯消消乐 状压dp加普通dp
  20. [字符串题-java]1189. “气球” 的最大数量

热门文章

  1. 微信/qq/防撤回插件
  2. iQOO Neo6 SE什么时候发布 iQOO Neo6 SE配置如何
  3. Idea快捷键大全(比较全的)
  4. CSS 中文字体的英文名称 (simhei, simsun) 宋体 微软雅黑
  5. python官方文档中文版-主页 - Keras 中文文档
  6. iBase4J项目笔记
  7. MATLAB 数据拟合方法
  8. ATAT的安装bug在centos7--换了个其他集群安装确没有问题(可能和系统的配置相关)
  9. 水系图一般在哪里找得到_天津大学钟澄ESM综述:高能量密度水系电池的核心组件盐包水电解质...
  10. Unity5.3 使用Awesomium插件内嵌网页