模态是指数据的存在形式,比如文本、音频、图像、视频等文件格式。有些数据的存在形式不同,但都是描述同一事物或事件的

常见的多模态问题有

视觉问答:针对图片提问题让计算机回答

多模态建索,用自然语言问句来搜图

多模态任务还有的比如模型在RGB数据集上训练,然后让在深度图或光流图上预测

跨模态/多模态 cross-modal相关推荐

  1. Cross-modal Pretraining in BERT(跨模态预训练)

    BERT以及BERT后时代在NLP各项任务上都是强势刷榜,多模态领域也不遑多让-仅在2019 年就有8+篇的跨模态预训练的论文挂到了arxiv上-上图是多篇跨模态论文中比较稍迟的VL-BERT论文中的 ...

  2. EMNLP 2021-多模态Transformer真的多模态了吗?论多模态Transformer对跨模态的影响

    关注公众号,发现CV技术之美 ▊ 写在前面 预训练的视觉语言BERT的目标是学习结合两种模态的表征.在本文中,作者提出了一种基于跨模态输入消融诊断方法(cross-modal input ablati ...

  3. 多模态 跨模态|人机交互新突破!

    我们对世界的认知和体验是多模式的,我们看向窗外,听到雨滴,闻到青草的味道,触摸到木板的纹理... 某种意义上来说,AI 就是赋予机器类人的感知和智慧,想要让 AI 理解我们周围的世界,它需要同时解释和 ...

  4. 利用跨模态 Transformer 进行多模态信息融合

    目录 1. 简介 2. 创新点 3. 模型描述 3.1 Low Rank Fusion 3.2 Multimodal Transformer 具体模块介绍 Temporal Convolutions ...

  5. 厨艺速成「秘籍」—— 跨模态菜谱检索 | 复旦大学陈静静

    导语:看到一道菜的成色,就能得知食材原料和烹饪方法? 在近期的AI TIME 青年科学家--AI 2000 学者专场论坛系列报告中,来自复旦大学计算机科学学院的助理教授陈静静博士带来了题为「跨模态菜谱 ...

  6. 【食品图像识别】跨模态菜谱检索

    导语:看到一道菜的成色,就能得知食材原料和烹饪方法? 在近期的AI TIME 青年科学家--AI 2000 学者专场论坛系列报告中,来自复旦大学计算机科学学院的助理教授陈静静博士带来了题为「跨模态菜谱 ...

  7. 论文笔记--跨模态检索研究综述-2018

    论文信息: 期刊论文-跨媒体检索研究综述-2018-欧卫华 文末部分参考文献附有论文下载链接,并提供了本论文下载地址 转载本文请添加以下引用: 作者:lingpy 本文链接:https://blog. ...

  8. 文献记录(part19)--Cross modal similarity learning with active queries

    学习笔记,仅供参考,有错必纠 关键词:主动学习;跨模态相似学习;度量学习 文章目录 Cross modal similarity learning with active queries 摘要 简介 ...

  9. 论文笔记--跨模态间的人脸与人名对齐方法研究-2012

    论文信息: 硕士论文-跨模态间的人脸与人名对齐方法研究-2012-复旦大学-吴伟 文末附人脸标注论文下载地址 文章目录 摘要 技术 框架图 人名重要性评估 人名检测 句法分析获得人名重要性&语 ...

最新文章

  1. 夏天来了,你的数据中心应该跟着热起来
  2. 数据如何从HBase读到MR
  3. 从VS2008+QT4到VS2015+QT5迁移过程中遇到的问题及解决方法
  4. 原来,07年我把自己给和谐了
  5. python画图如何调整图例位置_matplotlib中legend位置调整解析
  6. Ubuntu首次开启root用户
  7. SQL Server 2000从入门到精通3
  8. IEEE Transactions on BIG DATA影响因子3.344,进入信息学科计算机理论与方法领域Q1区...
  9. 常见索引结构—B-树
  10. jboss war包放哪_如何将JBoss HR Employee Rewards项目放入云端
  11. linux 下安装minio并配置
  12. 计算机组成原理计算tag,计算机组成原理计算题
  13. linux不允许将硬链接指向目录,为什么 UNIX/Linux 不允许目录硬链 【翻译】
  14. F5入口IP依据不同的端口实现转发到不同的POOL
  15. 机电传动与控制【1】
  16. LabVIEW FPGA PCIe开发讲解-实战篇:实验61:PCIe DMA+8位ADC(模拟数据采集卡)
  17. 微信服务号、订阅号和企业号的差别
  18. 餐巾计划(网络流24题之二(模板2))
  19. 国王的烦恼 蓝桥杯(最小生成树 kru)
  20. poj3580:SuperMemo(块状链表/Splay)

热门文章

  1. BugPhobia启程篇章:需求分析与功能定位
  2. 类似冒险岛这类游戏是用什么语言编写?或者说它的制作流程是什么?
  3. DHU OJ | 进阶练习-22 汽水瓶
  4. 微信王者有ios的服务器吗,就没有iOS微信区的吗...
  5. 数据分析-描述数据方法
  6. 计算机组装与拆解中容易混淆的知识点,教资干货 | 教资笔试中易混淆的知识点整合...
  7. JSP Web学习心得
  8. Echarts:10-7-4:混合图(降水量蒸发量平均温度)
  9. 英语四/六级作文模板
  10. ShareSDK Android SDK API