贝叶斯神经网络,简单来说可以理解为通过为神经网络的权重引入不确定性进行正则化(regularization),也相当于集成(ensemble)某权重分布上的无穷多组神经网络进行预测。

本文主要基于 Charles et al. 2015[1]

FBI WARNING:本文讨论的是 贝叶斯神经网络,而非 贝叶斯网络FBI WARNING:鉴于近期知乎上一些睿智发言,本文将所有术语翻译成了中文,请谨慎食用。

题图来源

0. 神经网络的概率模型

众所周知,一个神经网络模型可以视为一个条件分布模型

:输入
,输出预测值
的分布,
为神经网络中的权重。在分类问题中这个分布对应各类的概率,在回归问题中一般认为是(标准差固定的)高斯(Gaussian)分布并取均值作为预测结果。相应地,神经网络的学习可以视作是一个最大似然估计(Maximum Likelihood Estimation, MLE):

其中

对应我们用来训练的数据集(dataset)。回归问题中我们代入高斯分布就可以得到平均平方误差(Mean Squared Error, MSE),分类问题则代入逻辑函数(logistic)可以推出交叉熵(cross-entropy)。求神经网络的极小值点一般使用梯度下降,基于反向传播(back-propagation, BP)实现。

MLE 中不对

的先验概率作假设,也就是认为
取什么值的机会都均等。如果为
引入先验,那就变成了最大后验估计(Maximum Posteriori, MAP):

代入高斯分布可以推出 L2 正则化(倾向于取小值),代入拉普拉斯分布(Laplace)可以推出 L1 正则化(倾向于取 0 使权重稀疏)。

1. 贝叶斯起来了!

贝叶斯估计(bayesian estimation)同样引入先验假设&

优化概率神经网络_Bayesian Neural Networks:贝叶斯神经网络相关推荐

  1. 贝叶斯神经网络(系列)第一篇

    本文为 AI 研习社编译的技术博客,原标题 : Bayesian Neural Network Series Post 1: Need for Bayesian Neural Networks 作者 ...

  2. 贝叶斯神经网络计算核裂变碎片产额

    作者丨庞龙刚 单位丨华中师范大学 研究方向丨高能核物理.人工智能 今天介绍一篇北京大学物理系使用贝叶斯神经网络计算核裂变碎片产额的文章.这篇文章发表在 PRL 上,业内同行都很感兴趣.这里对我们大同行 ...

  3. 贝叶斯神经网络的 MCMC 训练 MCMC Training of Bayesian Neural Networks

    from: http://www.fields.utoronto.ca/talks/MCMC-Training-Bayesian-Neural-Networks 一.贝叶斯神经网络模型 Bayesia ...

  4. pytorch贝叶斯网络_贝叶斯神经网络:2个在TensorFlow和Pytorch中完全连接

    pytorch贝叶斯网络 贝叶斯神经网络 (Bayesian Neural Net) This chapter continues the series on Bayesian deep learni ...

  5. ​贝叶斯神经网络最新综述

    ©PaperWeekly 原创 · 作者|尹娟 学校|北京理工大学博士生 研究方向|随机过程.复杂网络 论文标题:Bayesian Neural Networks: An Introduction a ...

  6. 贝叶斯神经网络对梯度攻击的鲁棒性

    ©PaperWeekly 原创 · 作者|尹娟 学校|北京理工大学博士生 研究方向|随机过程.复杂网络单位 引言 贝叶斯神经网络(BNN)在最近几年得到了一定的重视,因为其具有一定的推断能力.BNN ...

  7. 贝叶斯深度神经网络_深度学习为何胜过贝叶斯神经网络

    贝叶斯深度神经网络 Recently I came across an interesting Paper named, "Deep Ensembles: A Loss Landscape ...

  8. 浅析贝叶斯神经网络(Based on Variational Bayesian)

    贝叶斯神经网络简介 对于一个神经网络来说,最为核心的是如何根据训练集的数据,得到各层的模型参数,使得Loss最小,因其强大的非线性拟合能力而在各个领域有着重要应用.而其问题是在数据量较少的情况下存在严 ...

  9. 深度学习之卷积神经网络(Convolutional Neural Networks, CNN)(二)

    前面我们说了CNN的一般层次结构, 每个层的作用及其参数的优缺点等内容.深度学习之卷积神经网络(Convolutional Neural Networks, CNN)_fenglepeng的博客-CS ...

最新文章

  1. 【Linux】服务器常用命令
  2. BASIC-4 数列特征
  3. 归一化、标准化和正则化
  4. suse linux 10 ftp服务配置
  5. Windows 控制台cmd中文乱码的解决办法
  6. 为什么我们程序员难晋升
  7. 物质之学 —— 金属
  8. 计算机网络相关知识、名词总结
  9. Exchange 2003 和 Exchange 2007最大处理器数、内存支持比较
  10. 2018谷歌学术影响因子发布:CVPR排名泛AI领域第一
  11. 缺失索引自动创建语句
  12. MYSQL 数据库配置优化
  13. 学会这招,轻松实现批量PDF转jpg,快来码住
  14. STM8S103之串口中断接收
  15. android计算器如何保存记录,计算器历史记录怎么看
  16. 杭电2818——带权并差集
  17. 剪辑画中画视频,如何用视频实现画中画效果
  18. B站弹幕姬()分析与开发(上篇)
  19. Word中令人头疼的字体转换
  20. 艾兰岛编辑器-玩家角色

热门文章

  1. 2021年安全员-C证(广西省-2021版)考试APP及安全员-C证(广西省-2021版)模拟考试
  2. 电气火灾监控系统的方案介绍 安科瑞 许敏
  3. 简单的接口和抽象类实现模板设计模式
  4. 群晖安装浏览器及配置网络认证
  5. selenium之安装浏览器驱动
  6. SpringSecurity和SpringSocial实现QQ登录
  7. 华为畅享9 Plus前沿硬件技术齐上阵 千元机游戏“旗舰”机体验
  8. mysql导入数据报错 Incorrect date value: '0000-00-00' for column
  9. 移动端页面禁止双指缩放
  10. KPCA-KLPP的MATLAB实现