?深度强化学习:
    机器学习的分支:深度学习和强化学习。
    深度学习是一种机器学习中建模数据的隐含分布的多层表达的算法。换句话来说,深度学习算法自动提取分类中所需要的低层次或者高层次特征。因此深度学习能够更好的表示数据的特征,同时由于模型的层次、参数很多,容量也足够,因此,深度学习模型有能力表示大规模数据,所以对于图像、语音这种特征不明显的棘手问题,反而能够借助深度学习在大规模训练数据上取得更好的效果。而且由于深度学习将特征和分类器结合到一个框架中,用数据去学习特征,在使用中减少了手工提取特征的巨大工作量,因此,不仅仅效果可以更好,而且应用起来也非常方便。因此深度学习在图像识别和语音识别方面获得了巨大的进步。
  强化学习,其实,就是一个连续决策的过程,其特点是不给任何数据做标注,仅仅提供一个回报函数,这个回报函数决定当前状态得到什么样的结果(比如“好”还是“坏”),从数学本质上来看,还是一个马尔科夫决策过程。强化学习最终目的是让决策过程中整体的回报函数期望最优。
?类人概念学习
   深度学习基于大数据通过多层网络实现对“抽象概念”的理解,显然数据越多其效果相对就会越好,但是若没有大数据怎么办?何况人类的知识也是一点点积累的,对于人类来说,即便没有积累,没有相应的专业知识,实际上我们也能“照猫画虎”。从这点上来看,以深度学习为核心的人工智能就远远不及人类,因为人类面对陌生环境依然能够通过学习做出适应变化。因此“类人概念学习”首先就要解决深度学习的这种弊端,即不依赖大数据也能进行自我学习,笔者通常定义为“小样本学习”。
   小样本学习的核心就是BPL贝叶斯规划学习(Bayesian Program Learning, BPL).BPL方法是利用参数的先验分布,由小样本信息求来的后验分布,直接求出总体分布。这种方法使用概率去表示所有形式的不确定性,通过概率规则来实现学习和推理过程。
   BPL方法的优势:BPL方法观察到的每个训练样例可以增量地降低或升高某假设的估计概率,而其他算法会在某个假设与任一样例不一致时完全去掉该假设。但是BPL方法需要概率的初始知识,当概率预先未知时,可以基于背景知识、预先准备好的数据以及基准分布的假定来估计这些概率。
 深度学习DL和贝叶斯规划学习BPL的对比:
  DL解决的是计算机“运筹帷幄”的问题,实现的是”要从大量数据形成抽象“,在数据量巨大但较混乱的情况下能发挥优势;BPL解决的是计算机”照猫画虎“的问题,实现的是”仅从一个例子就能形成概念“,在数据量较少而清晰的情况下占领上风。

本篇仅作为了解贝叶斯规划的笔记,内容摘自:

浅谈小样本的类人概念学习与大数据的深度强化学习的区别? - 大数据分析_大数据处理_大数据技术_云计算
http://www.raincent.com/content-10-6009-1.html

涉及论文:Brenden M. Lake等人撰写的《Human-level concept learning through probabilistic program induction》

贝叶斯规划学习BPL相关推荐

  1. 贝叶斯深度学习2020 最新研究总结

    作者丨Ziyue Wu@知乎 来源丨https://zhuanlan.zhihu.com/p/283633149 编辑丨极市平台 本文仅作学术分享,若侵权,请联系后台作删文处理. 一个综合的人工智能系 ...

  2. 【MIT港科大】最新《贝叶斯深度学习》2020综述论文,35页pdf全面阐述最新进展...

    来源:专知 来自MIT和香港科技大学的学者最新<贝叶斯深度学习>综述论文,值得关注! 地址: https://www.zhuanzhi.ai/paper/9b781282204cb581a ...

  3. 贝叶斯网络结构学习之K2算法(基于FullBNT-1.0.4的MATLAB实现)

    题目:贝叶斯网络结构学习之K2算法(基于FullBNT-1.0.4的MATLAB实现) 有关贝叶斯网络结构学习的一基本概念可以参考:贝叶斯网络结构学习方法简介 有关函数输入输出参数的解释可以参考:贝叶 ...

  4. NeurIPS 2019最热趋势-贝叶斯深度学习

    贝叶斯原理,总感觉憋着,不透.关注到一篇文章介绍NIPS2019最新趋势中有关于贝叶斯深度学习的,还是担心链接失效,博客这里mark关键信息. 链接:https://mp.weixin.qq.com/ ...

  5. 变分贝叶斯深度学习综述

    ©PaperWeekly 原创 · 作者 | 薛博阳 单位 | 香港中文大学 研究方向 | 语言模型 引言 近年来,贝叶斯深度学习(Bayesian Deep Learn-ing)在诸多领域得到广泛关 ...

  6. 真的不值得重视吗?ETH Zurich博士重新审视贝叶斯深度学习先验

    ©作者 | 杜伟.力元 来源 | 机器之心 一直以来,贝叶斯深度学习的先验都不够受重视,这样真的好么?苏黎世联邦理工学院计算机科学系的一位博士生 Vincent Fortuin 对贝叶斯深度学习先验进 ...

  7. 贝叶斯网络学习Python环境搭建(pgmpy)

    文章目录 相关学习链接 pgmpy安装 torch安装 安装步骤 问题 相关学习链接 贝叶斯结构学习基础 贝叶斯网络结构学习方法总结 贝叶斯网络实战(泰坦尼克) pgmpy安装(python的BN库) ...

  8. 基于搜索的贝叶斯网络结构学习算法-K2

    部分内容取自:[Cooper and Herskovits, 1991] Cooper, G. and Herskovits, E. (January, 1991). A Bayesian metho ...

  9. 基于图正则化的贝叶斯宽度学习系统

    摘要 作为一种前馈神经网络,宽度学习系统因其精度高.训练速度快且能有效代替深度学习方法而备受研究者的关注.然而,宽度学习系统存在对网络中的特征节点个数比较敏感且求伪逆方式易使模型出现过拟合等问题.为此 ...

最新文章

  1. 2022-2028年中国散热产业深度调研及投资前景预测报告(全卷)
  2. Django 视图URLconf3.1
  3. linux cat 查看文件内容 不带#号的,Linux下如何不用cat命令读取文件内容
  4. shell 常用命令语句
  5. Jenkins中连接Git仓库时提示:error: The requested URL returned error: 401 Unauthorized while accessing
  6. 因为阿里,他们成了“杭漂”
  7. 让企业零成本拥有自己独立的企业网站不再是问题...
  8. 当前订单不支持只花呗支付是什么意思_双十一购物季活动购物金叠加规则是什么,女装促销汇网...
  9. 图神经网络(一)图信号处理与图卷积神经网络(2)图信号与图的拉普拉斯矩阵
  10. JavaScript URL参数读取
  11. 完美:C# Blazor中显示Markdown并添加代码高亮
  12. 解决Maven工程install时[WARNING] Using platform encoding (UTF-8 actually) to copy filtered resources
  13. figtree如何编辑进化树_进化树的注释:ggtree
  14. HDU2525 Clone Wars【模拟】
  15. PySpark RDD 之collect、 take、top、first取值操作
  16. 计算机考研复习资料推荐
  17. R语言实现并行计算[parallel,Rdsm]
  18. Jenkins 打包项目出错汇总(持续)
  19. 未分配利润与利润表不一致_资产负债表中的未分配利润和利润表中的净利润肯定是一致的吗?...
  20. 好的 免费 报表控件 很多

热门文章

  1. 小小的宏 大大的世界
  2. Ubuntu 14.04 更换源(官方源——阿里源)
  3. Linux系统aboutyou,Linux字符设备驱动高级
  4. 在竞争激烈的情况下,ReentrantLock与CAS的性能比较
  5. 直播App竞争激烈,请你分析,在这个红海市场中,各家App彼此竞争的关键因素有哪些?其中最重要的是什么?
  6. 使用uiautomator2获取Android抖音直播间评论数据
  7. 用户在Eightcap易汇平台可以交易哪些产品?投资选择多吗?
  8. Remote Desktop User
  9. 快速熟悉H3 BPM的结构
  10. phpBB 2.06漏洞