目录

  • 简介
  • 动机
  • 方法
  • 实验

简介

论文链接

动机

由于cv中的方法通常会过拟合数据集,所以很多学者尝试让这些方法对“域变化”鲁棒。但是,这些domain adaptation方法并不适用于VQA任务,主要由于三个原因:

  1. VQA任务的输入是多模态的;
  2. VQA方法由不同的模块构成了多个步骤,导致优化复杂;
  3. 不同的VQA数据集的answer space是不同的。

为了应对上述问题,作者主要做了以下三个方面的工作:

  1. 量化不同VQA数据集之间的domain shift,并在image和question domain分别合成了新的数据。
  2. 测试了不同类型的VQA方法的鲁棒性。
  3. 测试了现有的domain adaptation方法,并提出了一个新的更适用于VQA任务的方法。

方法

个人认为,本文主要的贡献在于,作者通过分析不同方法的鲁棒性,得出“NMNs方法较为鲁棒”的结论,进一步做了“推理是和domain无关”的假设。根据这个假设,作者设计了适用于VQA领域的domain adaptation方法,也就是下图中的Two-stage DA。核心思想就是,把Visual Encoder预训练好,再去训练VQA模型(此时保持Visual Encoder不更新)。也就是说:Training Stage 1学习表达,Training Stage 2学习推理,由于“推理和domain无关”,所以得到的模型更加鲁棒。

实验

下图是作者测试了不同VQA数据集之间的domain gap:

下表是不同类方法的domain adaptation性能测试(分别是image shift和question shift情况下):


接下来,作者测试了本文提出的训练策略和已有的domain adaptation方法的对比:

CVPR 2021 《Domain-robust VQA with diverse datasets and methods but no target labels》论文笔记相关推荐

  1. AAAI 2021 《Regularizing Attention Networks for Anomaly Detection in Visual Question Answering》论文笔记

    目录 简介 动机 方法 实验 简介 本文是POSTECH和Kakao合作的一篇文章. 论文链接 动机 异常检测有助于提升模型的稳定性和可靠性,也就是鲁棒性,OOD问题也可以视为一种异常.但是,单模态的 ...

  2. CVPR 2020 《Where Does It Exist: Spatio-Temporal Video Grounding for Multi-Form Sentences》论文笔记

    目录 简介 动机 贡献 方法 实验 简介 本文也是一篇poster,作者出自浙大.阿里巴巴和电科大. 本文提出了一个新的task--STVG(Spatio-Temporal Video Groundi ...

  3. CVPR 2017 ADNet:《 Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning》论文笔记

    理解出错之处望不吝指正. 本文模型叫做ADNet.该模型通过强化学习产生动作序列(对bbox进行移动or尺度变换)来进行tracking.原理如下图(第一列代表初始帧,第二列和第三列代表通过RL产生的 ...

  4. CVPR 2018 Siam-RPN:《High Performance Visual Tracking with Siamese Region Proposal Network》论文笔记

    理解出错之处望不吝指正. 本文模型叫做Siam-RPN.本文将Siamese Network和RPN结合,提出了一种端到端的离线训练方法,并把tracking过程视为one-shot detectio ...

  5. 【CVPR 2021】剪枝篇(一):Network Pruning via Performance Maximization

    [CVPR 2021]剪枝篇(一):Network Pruning via Performance Maximization 论文地址: 主要问题: 主要思路: 具体实现: 基本符号: 子网络生成: ...

  6. CVPR 2021 论文和开源项目合集(Papers with Code)

    摘自:https://github.com/amusi/CVPR2021-Papers-with-Code CVPR 2021 论文和开源项目合集 CVPR 2021 论文和开源项目合集(Papers ...

  7. 汇总|CVPR 2021 自动驾驶相关论文

    在科学研究中,从方法论上来讲,都应"先见森林,再见树木".当前,人工智能学术研究方兴未艾,技术迅猛发展,可谓万木争荣,日新月异.对于AI从业者来说,在广袤的知识森林中,系统梳理脉络 ...

  8. CVPR 2021论文视角:计算机视觉现状

    点击上方"机器学习与生成对抗网络",关注星标 获取有趣.好玩的前沿干货! 作者 Georgian 来源 DeepHub IMBA 编辑 极市平台 本文根据今年的CVPR录用结果总结 ...

  9. CVPR 2021 | 论文大盘点:3D目标检测

    作者丨我爱计算机视觉@知乎 来源丨https://zhuanlan.zhihu.com/p/389319123 编辑丨3D视觉工坊 本篇汇总 3D 目标检测相关论文,包含基于单目.基于深度图.基于激光 ...

最新文章

  1. 这就是为什么我们需要在React的类组件中绑定事件处理程序
  2. android获取自定义属性,android 自定义控件中获取属性的三种方式(转)
  3. 《UML用户指南第二版》再次温读笔记(一)(downmoon)
  4. sklearn自学指南(part52)--潜在狄利克雷分配(LDA)
  5. golang go语言_在Go语言中无需反思即可使用Lodash的好处
  6. 计算机专业必备电子书单
  7. Android4.2中Phone的P-sensor的应用的分析。
  8. sparksql读取mysql表的两种方式
  9. golang在windows下编译Linux下的文件
  10. 在Python中从头开始模拟退火
  11. Science杂志公布的机器学习资源
  12. Latex Error: File ended while scanning use of \@xdblarge
  13. steam一键授权工具_超实用小工具!一键将PC其它平台的游戏导入Steam
  14. 震惊·X话最少的~“原理图更新到PCB时出现Unknown Pin: PinXXX 问题解决方案”
  15. 打算开源一个低代码平台,第三天,包含【工作流,业务流,财务,APQC】。技术站 React,typescript,java,mysql
  16. Set集合:求交集、并集和差集
  17. 图解 OSPF :什么是 LSA ?
  18. 网站pc端和手机端视频的处理
  19. 软考__BS家族_WBS_OBS_RBS
  20. 【读书笔记】点亮心中的那盏灯

热门文章

  1. [云炬创业基础]创业过程
  2. 科大星云诗社动态20210514
  3. [一维粒子模拟 version3.6]成功实现初次诊断函数
  4. 开源!《模式识别与机器学习(PRML)》笔记、代码、NoteBooks 发布
  5. VTK修炼之道47:图形基本操作进阶_法向量计算
  6. Delphi中的Rtti函数
  7. 解决pip异常:No module named ‘pip‘
  8. 任务和特权级保护(一)——《x86汇编语言:从实模式到保护模式》读书笔记27
  9. Linux 磁盘管理命令
  10. java return this