刚找的综述性文章:这两篇我没怎么看不知道怎么样

Visual Question Answering: Datasets,Algorithms, and Future Challenges

Visual Question Answering: A Survey ofMethods and Datasets

论文:

A multi-world approach to question answeringabout real-world scenes based on uncertain input. NIPS, 2014.

比较早的一篇文章

Ask Your Neurons: A Neural-based Approach toAnswering Questions about Images. ICCV 2015

这篇文章也比较早,方法比较基础,VQA初期采用的方法

Where To Look: Focus Regions for VisualQuestion Answering。

加入attention机制的一篇文章

Image Question Answering using ConvolutionalNeural Network with Dynamic Parameter Prediction. CVPR 2016,

想法比较好,我之前一篇文章就是基于这篇做了进一步工作

Exploring models and data for image questionanswering. NIPS, 2015.

加拿大那边的一篇文章提出了一个数据集,规模较小但是可以算最早的数据集

Learning to Answer Questions From Image UsingConvolutional Neural Network, AAAI, 2016.

好像是李航老师的文章,感觉效果一般

Compositional Memory for Visual QuestionAnswering .

Hierarchical Question-Image Co-Attention forVisual Question Answering。NIPS2016,

采用图像attention问题,再用问题attention图像

Dynamic Memory Networks for Visual andTextual Question Answering。

这篇文章比较犀利,在处理文本问答和图像问答都可以,而且效果比较好

Ask Me Anything: Free-form Visual QuestionAnswering Based on Knowledge from External Sources CVPR 2016

沈春华老师的文章,这篇加入了外接知识库

Visual7W: Grounded Question Answering inImages CVPR 2016

李飞飞老师的文章,这篇提出了一个新的数据集Visual7W

Stacked Attention Networks for Image QuestionAnswering

采用多次关注聚焦的方式来处理定位问题关注点

VQA: Visual Question Answering

提出了目前最大的数据集mscocoQA 网页:http://www.visualqa.org/

Neural Module Networks

这篇文章也比较犀利,他有个姊妹篇,同一作者。而且差不多,这篇是更好的一篇,cvpr2016,根据问题不同动态组合网络。

Image Captioning and Visual QuestionAnswering Based on Attributes and Their Related External Knowledge

沈春华老师的文章,提取高层次语义概念的图像特征

最近应该还有新的论文,可以再arxiv上搜一下,因为最近没在弄视觉问答所以也没怎么跟这方面的论文了

视觉问答(Visual Question Answering)论文初步整理相关推荐

  1. WeaQA:Weak Supervision via Captions for Visual Question Answering 论文笔记

    WeaQA:Weak Supervision via Captions for Visual Question Answering论文笔记 一.Abstract 二.引言 三.相关工作 3.1 VQA ...

  2. LPF: A Language-Prior Feedback Objective Function for De-biased Visual Question Answering 论文笔记

    LPF: A Language-Prior Feedback Objective Function for De-biased Visual Question Answering 论文笔记 一.摘要 ...

  3. 《Generating Question Relevant Captions to Aid Visual Question Answering》(生成问题相关标题,以帮助视觉回答问题)论文解读

    下面是我对最近阅读的论文<Generating Question Relevant Captions to Aid Visual Question Answering>的一些简要理解 一. ...

  4. <<视觉问答>>2021:Zero-shot Visual Question Answering usingKnowledge Graph

    目录 摘要: 一.介绍 二.相关工作 2.1.Visual Question Answering 2.2.Zero-shot VQA 三.Preliminaries 四.Methodology 4.1 ...

  5. 【NIPS2018】Reasoning with Graph Convolution Nets for Factual Visual Question Answering【事实视觉问答推理】

    "Out of the box:Reasoning with Graph Convolution Nets for Factual Visual Question Answering&quo ...

  6. <<视觉问答>>2021:Learning Compositional Representation for Few-shot Visual Question Answering

    目录 摘要 一.介绍. 二.RELATED WORK A. Visual Question Answering (VQA) B. Few-shot Learning C. Learning with ...

  7. 【自然语言处理】--视觉问答(Visual Question Answering,VQA)从初始到应用

    一.前述 视觉问答(Visual Question Answering,VQA),是一种涉及计算机视觉和自然语言处理的学习任务.这一任务的定义如下: A VQA system takes as inp ...

  8. 论文阅读—Relation-Aware Graph Attention Network for Visual Question Answering

    论文阅读-Relation-Aware Graph Attention Network for Visual Question Answering 一.标题 用于视觉问答的关系感知图注意力网络 二.引 ...

  9. 论文阅读Check it again:Progressive Visual Question Answering via Visual Entailment

    论文:Check it again:Progressive Visual Question Answering via Visual Entailment 代码:https://github.com/ ...

最新文章

  1. c语言中输入10,10 is greater than 0,2013练习题__Student
  2. matlab怎么画一箭穿心,MATLAB学习与使用:如何绘制三维心形图 经验告诉你该这样...
  3. 科学的分析猪八戒到底是什么猪,黑猪还是白猪?
  4. HashMap的put方法(Java7)和putVal方法(Java8)
  5. java 32位_Java知识点:创建节约内存的JavaBean
  6. linux(十三)之磁盘分区、创建文件系统、挂载
  7. 程序员的奋斗史(二)——今天你跑步了吗
  8. mysql的time格式化_【mysql格式化日期】
  9. C#如何设置Listview的行高-高度 转载
  10. 用“小红的下任男友是谁”通俗解释强化学习中的 基于模型方法 与 免模型方法
  11. nodejs初探(四)实现一个多人聊天室
  12. 程序员面试金典——18.4 2的个数
  13. 自然语言处理入门——RNN架构解析
  14. 8086汇编语言(一) 汇编语言源程序
  15. 运放电路的反馈电阻上并联一个电容是什么作用
  16. Coinbase与华尔街的内幕故事
  17. python中result的用法_python中result的用法
  18. 广州大学校园网路由器傻瓜式自助刷机教程
  19. URL Protocol- -(coolice)
  20. 单调有界定理适用于函数吗_实数的完备性定理

热门文章

  1. OSGB转SLPK过程中,更换临时文件夹路径的方法
  2. kill命令、killall命令、pkill 命令
  3. html布局flex有什么优势,flex布局的优缺点是什么
  4. python培训班上海嘉定
  5. DCA1000EVM使用指南
  6. 427 建立四叉树(递归、二维前缀和)
  7. 数据要素市场化的基本特征
  8. python怎么用numpy函数_Python numpy.ravel函数方法的使用
  9. 关于网易门户网站框架结构的思考(1)
  10. 再获国际权威技术研究机构认可!Rancher获评451 Research卓越创新者