多模态深度学习:用深度学习的方式融合各种信息
点击上方“视学算法”,关注公众号,选择加“星标“或“置顶”
作者:Purvanshi Mehta
编译:ronghuaiyang
导读
使用深度学习融合各种来源的信息。
多模态数据
我们对世界的体验是多模态的 —— 我们看到物体,听到声音,感觉到质地,闻到气味,尝到味道。模态是指某件事发生或经历的方式,当一个研究问题包含多个模态时,它就具有多模态的特征。为了让人工智能在理解我们周围的世界方面取得进展,它需要能够同时解释这些多模态的信号。
例如,图像通常与标签和文本解释相关联,文本包含图像,以更清楚地表达文章的中心思想。不同的模态具有非常不同的统计特性。
多模态深度学习
虽然结合不同的模态或信息类型来提高效果从直观上看是一项很有吸引力的任务,但在实践中,如何结合不同的噪声水平和模态之间的冲突是一个挑战。此外,模型对预测结果有不同的定量影响。在实践中最常见的方法是将不同输入的高级嵌入连接起来,然后应用softmax。
多模态深度学习的例子,其中使用不同类型的神经网络提取特征
这种方法的问题是,它将给予所有子网络/模式同等的重要性,这在现实情况中是非常不可能的。
所有的模态对预测都有相同的贡献
对网络进行加权组合
我们采用子网络的加权组合,以便每个输入模态可以对输出预测有一个学习贡献(Theta)。
我们的优化问题变成-
对每个子网络给出Theta权值后的损失函数。
将权值附加到子网后预测输出。
把所有的都用起来!
准确性和可解释性
我们在两个现实多模态数据集上得到了SOTA:
Multimodal Corpus of Sentiment Intensity(MOSI) 数据集 —— 有417个标注过的视频,每毫秒标注的音频特征。共有2199个标注数据点,其中情绪强度定义为从strongly negative到strongly positive,线性尺度从- 3到+3。
模态包括:
1、文本
2、音频
3、语言
每种模态对情绪预测的贡献量
Transcription Start Site Prediction(TSS)数据集 —— Transcription是基因表达的第一步,在这一步中,特定的DNA片段被复制到RNA (mRNA)中。Transcription起始位点是transcription开始的位置。DNA片段的不同部分具有不同的特性,从而影响其存在。我们将TSS分为三个部分:
上游DNA
下游DNA
TSS位置
我们取得了前所未有的改善,比之前的最先进的结果3%。使用TATA box的下游DNA区域对这一过程影响最大。
—END—
英文原文:https://towardsdatascience.com/multimodal-deep-learning-ce7d1d994f4
多模态深度学习:用深度学习的方式融合各种信息相关推荐
- 深度学习多模态融合_多模态深度学习:用深度学习的方式融合各种信息
作者:Purvanshi Mehta 编译:ronghuaiyang 原文链接多模态深度学习:用深度学习的方式融合各种信息mp.weixin.qq.com 导读 使用深度学习融合各种来源的信息. 多 ...
- 多模态理论与论文研究,如何入门及理解,学习分享-深度之眼多模态情感识别
学习经验 多模态学习旨在使计算机拥有处理不同来源信息的能力,近年来成为了人工智能领域的研究热点.多模态学习将不同模态信息进行融合,学习不同模态信息之间的关联. 和朋友搭伙研究了多模态,学习了 深度之眼 ...
- 干货 | 台大“一天搞懂深度学习”课程PPT(下载方式见文末!!)
微信公众号 关键字全网搜索最新排名 [机器学习算法]:排名第一 [机器学习]:排名第一 [Python]:排名第三 [算法]:排名第四 Deep Learing Tutorial 本篇文章我们给出了一 ...
- 深度学习未来的三种方式
来源:海豚数据科学实验室 深度学习的未来在于这三种学习模式,而且它们彼此之间密切相关: 混合学习--现代深度学习方法如何跨越监督学习和非监督学习之间的边界,以适应大量未使用的无标签数据? 复合学习-- ...
- 《预训练周刊》第39期: 深度模型、提示学习
No.39 智源社区 预训练组 预 训 练 研究 观点 资源 活动 周刊订阅 告诉大家一个好消息,<预训练周刊>已经开启"订阅功能",以后我们会向您自动推送最新版的&l ...
- 美团招博士后啦!深度学习、强化学习、计算机视觉与NLP、法学方向
美团博士后工作站简介 美团博士后科研工作站是美团引进和培养高层次创新型优秀博士人才,推进产学研结合,增强企业创新能力的重要平台.工作站聚焦人工智能.无人驾驶.大数据等方向,从基础理论.关键技术.创新应 ...
- 【《深度学习入门》—— 学习笔记(二)】
<深度学习入门>-- 学习笔记(二)_5-8章 第五章 误差反向传播法 方法一:基于数学式 - 严密简洁 方法二:基于计算图(computational graph) - 直观 5.1 计 ...
- B站上线!DeepMind加UCL强强联手推出深度学习与强化学习进阶课程(附视频)
新智元报道 编辑:元子 [新智元导读]DeepMind和伦敦大学学院(University College London,UCL)合作,推出了一个系列的深度学习与强化学习精品进阶课程.该课程内 ...
- 深度学习未来发展的三种学习范式:混合学习,成分学习和简化学习
深度学习是一个很大的领域,其核心是一个神经网络的算法,神经网络的尺寸由数百万甚至数十亿个不断改变的参数决定.似乎每隔几天就有大量的新方法提出. 然而,一般来说,现在的深度学习算法可以分为三个基础的学习 ...
最新文章
- If using all scalar values, you must pass an index
- Mysql数据库主从及主主复制配置演示
- spring-data-redis 中使用RedisTemplate操作Redis
- Jsp中Uploadify插件的使用(jQuery上传插件)
- 【IntelliJ】IntelliJ IDEA的安装破解及使用
- 部署Smokeping
- win7做wifi服务器
- Django model 设置数据库 字段 编码
- python 写入excel 效率_python各种excel写入方式的速度对比
- 学习HanNLP2015年12月4日 16:24:53
- 使用虚拟机备份软件恢复云宏Winghong CNware虚拟机
- 国内C语言教材中几种值得商榷的说法
- 2022年危险化学品经营单位安全管理人员找解析及危险化学品经营单位安全管理人员复审考试
- 11.scrapy框架持久化存储
- 学习云计算为什么先学Linux?
- HyperLynx(十一)BoardSim和PCB板级仿真分析(二)
- 为什么量子计算机比经典计算机更强大,最新从实验层面证明:量子计算,确实比经典计算更具优势!...
- [Shader]踩脚印
- 如何在组织中有效使用低代码工具
- 利用yolov8零售商品识别实现的智能结算系统 yolo+后端flask+数据库sqlite+前端html(从零开始,全流程教学)
热门文章
- 2021-2022-1 线性代数知识点总结的视频
- Datawhale组队学习周报(第040周)
- matlab看fft帮助,日记 [2009年06月02日] MATLAB FFT HELP 帮助文档及我的翻译
- 用AI创造可持续发展社会价值,第二届腾讯Light·公益创新挑战赛正式启动
- Unet网络实现叶子病虫害图像分割
- Go后台项目架构思考与重构 | 深度长文
- 数据库设计的10个最佳实践
- TIOBE 1月编程语言排行榜:C语言再度「C 位」出道,Python惜败
- 飞桨博士会第三期来啦!中国深度学习技术俱乐部诚邀您加入
- 9月推荐 | 精选机器学习文章Top10