原文链接:http://papers.nips.cc/paper/4683-multimodal-learning-with-deep-boltzmann-machines.pdf

  1. 这篇文章描述了一种深度玻尔兹曼机,用于学习由多种输入模态组成的数据生成模型。
  2. 这样的模型可以用来提取将模态融合到一起的统一表示。
  3. 这些表示对分类和信息检索任务都很有用。
  4. 模型学习多模态输入空间上的学习概率密度。
  5. 模型使用潜在变量的状态作为输入的表示。
  6. 即使在缺少某些模态的情况下,也可以通过从条件分布中采样、查找来提取这些表示。
  7. 在由图像文本组成的双模态数据上的实验结果表明,多模态DBM可以学到一个良好的图像文本输入联合空间生成模型,这对于单模态和多模态查询中的信息检索很有用。

现实世界中的信息来源于多输入通道。图像与标题、标签相关;视频包括视觉和语音信号;感觉知觉包括视觉、听觉、运动和触觉通路的同步输入。每一种模态都有其独特的统计特性,所以必须正视他们来源于不同输入通道的事实。通过将这些模式融合到一个联合表示中,可以了解这些数据的有用表示,该联合表示捕获了数据对应的真实世界的“概念”。

eg: 我们想得到一个概率模型,将“beautiful sunset”一词的出现与beautiful sunset图像的视觉特性关联起来,并联合表示它们,以便模型可以根据其中一个,给另一个分配高概率。

其他重点摘取:

  • 文本通常表示为离散的稀疏字数向量,图像用像素强度或特征提取器的输出来表示,这些特征提取器是真值的和密集的。
  • 输入有很多结构,但是很难发现不同模态之间的 低级特征之间 存在的高度非线性关系。
  • 联合表示必定是这样:1) 表示空间的相似性意味着对应的“概念”的相似性;2) 另外也希望,即使在缺少某些模态的情况下,也能容易获得联合表示;3) 给出观察到的,应该有能力确定缺失的模态;4) 提取出来的表示对于识别任务是有用的。
  • DBMs是无向图模型,在隐藏单元的相邻层之间由双向连接。
  • 关键思想:学习多模态输入空间上的联合密度模型。
  • eg: 用大量人工标记的图像集,来学习图像和文本的联合分布,通过从中提取样本,可以确定缺失数据,从而分别进行图像标注和图像检索。
  • 关注的是:集成非常不同的数据模态:稀疏单词数量向量和实值密集图像特征。
  • 开发了一个深度玻尔兹曼机作为生成模型,而不是把网络展开,然后作为一个自动编码器,对它进行微调。

论文中的实验通过 Bimodal DBM,学习图片和文本的联合概率分布 P(图片,文本)。在应用阶段,输入图片,利用条件概率 P(文本|图片),生成文本特征,可以得到图片相应的文本描述;而输入文本,利用条件概率 P(图片|文本),可以生成图片特征,通过检索出最靠近该特征向量的两个图片实例,可以得到符合文本描述的图片。

Multimodal Learing with Deep Boltzmann Machines相关推荐

  1. Deep Boltzmann Machines

    转载自:http://blog.csdn.net/win_in_action/article/details/25333671  http://blog.csdn.net/zouxy09/articl ...

  2. REINFORCEMENT LEARNING USING QUANTUM BOLTZMANN MACHINES利用量子波兹曼机进行强化学习

    REINFORCEMENT LEARNING USING QUANTUM BOLTZMANN MACHINES 利用量子波兹曼机进行强化学习 Abstract. We investigate whet ...

  3. 29 深度玻尔兹曼机 Deep Boltzmann Machine

    1 Introduction 本章介绍的是深度玻尔兹曼机(Deep Boltzmann Machines,DBM),应该算是玻尔兹曼机系列的最后一个模型了.我们前面介绍的三种玻尔兹曼机和今天将要介绍的 ...

  4. 《Restricted Boltzmann Machines for Collaborative Filtering》理解与资料整理

    1 原文如下 2 理解 这篇文章尝试把RBM应用到协同过滤中,在netflix上的数据集做实验,RBM方法与SVD方法线性插值相结合,能提高系统性能6%左右. 2.1问题描述: 对电影的推荐,用户对电 ...

  5. 训练局限玻尔斯曼机(Training Restricted Boltzmann Machines)

        本栏目(Training Restricted Boltzmann Machines)包括内容的介绍.局限玻尔斯曼机与对比差异(CD)的回顾.使用CD时怎样纠正统计.迷你块大小(mini-ba ...

  6. 限制波尔兹曼机(Restricted Boltzmann Machines)

    限制波尔兹曼机(Restricted Boltzmann Machines) 能量模型的概念从统计力学中得来,它描述着整个系统的某种状态,系统越有序,系统能量波动越小,趋近于平衡状态,系统越无序,能量 ...

  7. 玻尔兹曼机的学习算法--Hinton论文系列《A learning algorithm for Boltzmann machines》

    1 简介 本文根据1985年Hinton等人写的<A learning algorithm for Boltzmann machines>翻译总结的.即玻尔兹曼机的学习算法. 连接主义认为 ...

  8. 训练RBM-Hinton系列论文《A practical guide to training Restricted Boltzmann Machines》

    目录 1 简介 1 2 RBMs和对比散度的概览 1 3 当使用对比散度时如何收集统计信息 2 3.1 更新隐藏状态 2 3.2 更新可见状态 3 4 Mini-batch大小 3 5 监控学习的过程 ...

  9. 简明深度学习方法概述 Deep Learning:Methods and Application

    简明深度学习方法概述 Deep Learning:Methods and Application  人工智能  小林子  7个月前 (03-05)  2558℃  0评论 作者:@神一手golden ...

最新文章

  1. 无需代码即可看视频造游戏!英伟达再现神操作!
  2. mysql与ofbiz,ofbiz+mysql安装求教
  3. C语言-文件操作总结
  4. 移动端-ibokan
  5. zcmu1156(树状数组)
  6. js div加载html_说说 Vue.js 中的 v-cloak 指令
  7. 罗马数字转阿拉伯数字
  8. java短信接口 调用_带你了解短信接口的调用
  9. linux中sybase删除数据库,Linux_Sybase ASE数据库的常见问题解答,1 数据库占用磁盘空间的形式 - phpStudy...
  10. 2020年,中国AI创业公司将走向何方
  11. cfiledialog 保存 扩展名_儿童美术:油画棒 插画一组超萌的大饼脸小孩 保存了跟小朋友一起画吧...
  12. 【Unity新闻】Unity发布白皮书《11种有效的玩家参与策略》
  13. pytest allure测试报告_pytest文档32allure描述用例详细讲解
  14. Android图片转化黑白图片,图像二值化,生成图像二值化后的黑白图像和图像矩阵(无压缩0,1矩阵),可灵活设置二值化值域
  15. 如何下载并安装mysql_超详细的MySQL下载与安装教程
  16. react全家桶指的是哪些?
  17. (原创)贴片电阻封装尺寸
  18. Java 身份证号码验证工具类
  19. 鲁大师2022年Q3手机报告:OPPO ColorOS重回国产UI榜首
  20. Spring Boot整合OpenOffice实现Word、Excel、PPT在线预览

热门文章

  1. python用mpl_finance中的candlestick_ohlc画分时图
  2. GeoGebra画正态分布密度曲线两种方式
  3. 域名和空间购买服务器系统,如何购买域名和空间?服务器有哪些类型?
  4. 模拟器 ❀ EVE-NG安装步骤
  5. 康涅狄格大学计算机科学排名,2019上海软科世界一流学科排名计算机科学与工程专业排名康涅狄格大学排名第401-500...
  6. 基于微信小程序的校园体育馆预约系统.docx
  7. 要不要一起爬山?百度大脑EasyDL邀你一起翻越企业AI落地的高山
  8. 打印0-999水仙花数java
  9. AIX7.1 安装配置 HPE 3PAR 存储驱动软件
  10. 纯CSS实现逼真翻页时钟