点击我爱计算机视觉标星,更快获取CVML新技术


近日,52CV群友jokieleung对视觉问答技术涉及到的近几年相关论文和代码进行了总结,并放到了Github上,对于想了解、跟踪该方向的朋友,非常值得参考。

分享网址:

https://github.com/jokieleung/awesome-visual-question-answering

何为视觉问答Visual Question Answering,VQA)?

以下为引用知乎深度学习大讲堂关于此的定义介绍。

视觉问答,是一种涉及计算机视觉和自然语言处理的学习任务。

这一任务的定义如下:

A VQA system takes as input an image and a free-form, open-ended, natural-language question about the image and produces a natural-language answer as the output。

翻译为中文:一个VQA系统以一张图片和一个关于这张图片形式自由、开放式的自然语言问题作为输入,以生成一条自然语言答案作为输出。简单来说,VQA就是给定的图片进行问答。

VQA系统需要将图片和问题作为输入,结合这两部分信息,产生一条人类语言作为输出。针对一张特定的图片,如果想要机器以自然语言来回答关于该图片的某一个特定问题,我们需要让机器对图片的内容、问题的含义和意图以及相关的常识有一定的理解。

VQA涉及到多方面的AI技术(图1):

细粒度识别(这位女士是白种人吗?)

物体识别(图中有几个香蕉?)

行为识别(这位女士在哭吗?)

和对问题所包含文本的理解(NLP)。

综上所述,VQA是一项涉及了计算机视觉(CV)和自然语言处理(NLP)两大领域的学习任务。它的主要目标就是让计算机根据输入的图片和问题输出一个符合自然语言规则且内容合理的答案。

在awesome-visual-question-answering项目中,作者精心总结了Visual Question Answering(VQA)(Image/Video Question Answering),Visual Question Generation ,Visual Dialog ,Visual Commonsense Reasoning 等相关领域的最新论文与对应代码。

作者称该工程将不断完善、持续更新,也欢迎大家提交相关资料。

再发一下网址:

https://github.com/jokieleung/awesome-visual-question-answering

点击阅读原文直达项目主页。

加群交流

关注计算机视觉与机器学习技术,欢迎加入52CV群,扫码添加52CV君拉你入群,

(请务必注明:52CV)

喜欢在QQ交流的童鞋,可以加52CV官方QQ群:702781905。

(不会时时在线,如果没能及时通过验证还请见谅)


长按关注我爱计算机视觉

Github:视觉问答最新资源汇总相关推荐

  1. 重磅资料!Github上的PHP资源汇总大全

    福利来了,PHP爱好者们!国外程序员ziadoz 在Github上收集整理了PHP的各种资源,内容包括模板.框架.数据库.安全等方面的库和工具.这篇文章,PHP100汇总了这些PHP资源,供各位 PH ...

  2. iOS【最新资源汇总】

    LearningIOS iOS初学者面对网上浩瀚的资料往往不知所措,为了让iOS初学者们少走弯路,少花时间在搜索资料上,个人为iOS初学者整理了一份学习资料.希望能帮助到大家. 源地址: https: ...

  3. Github上的PHP资源汇总大全

    依赖管理 --用于依赖管理的包和框架 Composer/Packagist : 一个包和依赖管理器 Composer Installers:  一个多框架Composer库安装器 Pickle: 可以 ...

  4. 转载 最全前端资源汇总

    一.概要 这份汇总整理,很程度上参考了GitHub最全前端资源汇总:云集前端教程.开发资源.免费书籍.手册规范.求职面试等等,旨在为前端学习 & 技能提升提供方便.当然,并不期望这成为一个前端 ...

  5. Github 4 万 Star!最全面的 Node.js 资源汇总推荐

    点击"程序员成长指北",选择"星标????" 让一部分开发者看到未来 作者@前哨君|地址@https://github.com/jobbole/awesome- ...

  6. 【Awsome】GitHub 资源汇总(更新中)

    以下为极市分享的Awsome系列GitHub资源汇总,包含人脸.姿态.目标跟踪.语义分割.OCR等,欢迎收藏阅读~~ 点击**加入极市CV技术交流群**,交流更多计算机视觉相关的技术干货 **原文链接 ...

  7. 微信小程序最新开发资源汇总,对学习微信小程序的新手有一定帮助

    微信小程序最新开发资源汇总,希望给想学习或正在学习微信小程序开发的同学们带来一定帮助,汇总的小程序资源有点繁杂,各种类型的小程序demo都有,大家可以选择自己想要的demo进行下载学习.这些微信小程序 ...

  8. 年龄估计系列(1)年龄性别调研:论文阅读和github资源汇总/数据库/挑战/思考

    目录 一.论文阅读和github资源汇总 1.1 论文 1.1.1 2012.人脸图像的年龄估计研究 1.1.2 2013.Age Estimation Face Images_Human vs Ma ...

  9. 一些有用的资源分享(工具+电子书+GitHub最全的前端资源汇总仓库(包括前端学习、开发资源、求职面试等))

    原地址:https://mp.weixin.qq.com/s/wSN1w2mM6Fh51RDGZYOdIQ 工具类 图片相关工具 TinyPNG:https://tinypng.com/ 免费的在线图 ...

最新文章

  1. mysql-4.0.20 use on scounix 5.0.7 error :dynamic linker:..:could not open libgthreads.so help!!!!
  2. Ubuntu16.04安装Pycharm2017.2
  3. openssl修改版本号
  4. Understanding Ethereum Smart Contracts
  5. 升级到VS.net 2008 sp1并安装卡巴斯基的兄弟们小心了
  6. boost::core::has_single_bit的测试
  7. socket , 套接口还是套接字,傻傻分不清楚
  8. Effective前端5:减少前端代码耦合
  9. MySql 你知道 order by 是怎么回事吗? MySql全字段排序与 rowid 排序
  10. webstorm apache设置 很方便啦
  11. python如何创建txt_如何通过读取.txt文件为每个键创建包含多个“列表”的Python字典?...
  12. 如何一个月减重20斤?
  13. python电影爬取并下载_python爬取电影并下载
  14. SharePoint Designer定制MOSS/WSS表单页面
  15. 草根创业,我劝你抓住网络培训的机会!
  16. requests模块练习1
  17. win7 共享计算机 网络密码怎么设置,Win7无线网络共享设置方法丨Win7无线网络共享设置方法图解...
  18. SpringBoot#InitBinder
  19. excel表格排序,4种排序教程全都有
  20. 【mysql】phpstudy8打开MySQL命令行的方法

热门文章

  1. 设计模式学习笔记——策略(Strategy)模式
  2. 算法竞赛——归并排序算法
  3. java oss如何下载文件_Java OSS批量下载并压缩为ZIP代码实例
  4. 检测php常量是否存在,php判断变量常量是否存在
  5. 河北省国家电网计算机专业,河北省国家电网计算机类题目库.doc
  6. mysql递归自身连接_Mysql递归连接
  7. 对计算机上的浏览器的介绍,挖掘IE浏览器的潜在功能(一) -电脑资料
  8. 楼宇计算机网络是如何工作的,【干货】建筑楼宇智能化如何应用 4C 技术
  9. java spi技术,Java SPI机制
  10. 2.9 while循环