【导读】Justin Johnson,斯坦福大学博士,导师是计算机视觉领域顶级学者李飞飞博士。研究兴趣包括计算机视觉和机器学习方面,涉及到视觉推理、视觉和语言,以及使用深层神经网络生成图像。Johnson目前是Facebook AI Research的研究科学家。从2019年秋季开始,我将加入密歇根大学计算机科学与工程专业,担任助理教授。Johnson在2018年夏天完成博士学位,其博士论文组成式视觉智能《Compositional visual intelligence》,195页详述采用组合式学习的方法对计算机视觉中图像描述、视觉问答、文本图像生成三方面的问题进行了研究,是组合式视觉智能的代表性研究工作。

https://cs.stanford.edu/people/jcjohns/


                                                    博士论文《Compositional visual intelligence》

论文题目:

Compositional visual intelligence

作者:

Johnson Justin

贡献者:

  • Li, Fei Fei, 1976- degree supervisor.

  • Goodman, Noah, degree committee member.

  • Ré, Christopher, degree committee member.

  • Stanford University. Computer Science Departmen

论文摘要:

  • 计算机视觉领域在过去几年取得了巨大的进步,这主要归功于卷积神经网络。尽管在传统的计算机视觉任务上取得了成功,但我们的机器系统离人类的一般视觉智能还有很长的路要走。视觉智能的一个重要方面是组合——对整体的理解源于对部分的理解。为了实现组成视觉智能的目标,我们必须探索新的计算机视觉任务,创建新的数据集,开发利用组成性的新模型。在这篇论文中,我将讨论我的工作在三个不同的计算机视觉任务涉及语言,其中包含的合规性帮助我们建立具有更丰富的视觉智能的系统。我将首先讨论图像标题描述:传统系统生成描述图像的简短句子,但是通过将图像分解为区域和描述分解为短语,我们可以生成两种更丰富的描述:密集的标题和段落。其次,我将讨论视觉问答:现有的数据集主要由简短的问题组成;为了研究更复杂的需要复合位置推理的问题,我们引入了一个新的benchark数据集。在此基础上,提出了一种可视化问题交互的显式组成模型,该模型将问题转换为功能程序,并通过组合神经模块来执行这些程序。第三,我将讨论文本到图像生成:现有的系统可以根据文本描述检索或生成单个对象的简单图像,但难以处理更复杂的描述。用对象和关系的构成场景图代替自由形式的自然语言,可以检索和生成包含多个对象的复杂图像。

论文结构:

Abstract

Acknowledgments

1 Introduction   概述

2 Dense Captioning - 密集视觉描述

3  Descriptive Image Paragraphs 描述性图像段落

4 A Dataset for Compositional Visual Reasoning   一个组成式视觉推理数据集

5 Programs for Visual Reasoning   视觉推理程序执行

6 Image Retrieval with Scene Graphs   基于场景图的图像检索

7 Image Generation from Scene Graphs  从场景图生成图像

8 Conclusions  总结

博士论文下载:关注公众号回复【Johnson】获取。

往期回顾

● 带你详细了解机器视觉竞赛—ILSVRC竞赛

● 到底什么是“机器学习”?机器学习有哪些基本概念?(简单易懂)

● 带你自学Python系列(一):变量和简单数据类型(附思维导图)

● 带你自学Python系列(二):Python列表总结-思维导图

● 2018年度最强的30个机器学习项目!

【资源】斯坦福李飞飞高徒Johnson博士论文: 组成式计算机视觉智能(附195页PDF)相关推荐

  1. 1357篇ECCV 2020论文打包下载!奖项公布:李飞飞高徒获最佳论文奖

    ↑ 点击蓝字 关注极市平台 部分内容来源丨机器之心 编辑|极市平台 极市导读 昨日,ECCV 2020五项大奖出炉,分别是最佳论文奖.最佳论文提名奖.Koenderink奖.Mark Everingh ...

  2. ECCV 2020最佳论文讲了啥?作者为ImageNet一作、李飞飞高徒邓嘉

    萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 作为计算机视觉三大顶会之一,备受瞩目的ECCV 2020(欧洲计算机视觉国际会议)最近公布了所有奖项. 其中,最佳论文奖被ImageNet一 ...

  3. ECCV 2020最佳论文讲了什么?作者为ImageNet一作、李飞飞高徒

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:量子位 AI博士笔记系列推荐 周志华<机器学习> ...

  4. 李飞飞高徒 Andrej Karpathy:计算机科学博士的生存指南

    李飞飞高徒 Andrej Karpathy:计算机科学博士的生存指南 英文版:A Survival Guide to a PhD

  5. 李飞飞高徒盘点年度十大AI亮点:核聚变、ChatGPT、AlphaFold上榜

    来源:新智元 人工智能的爆炸正在扭曲我们的时间感. 你能相信Stable Diffusion只有4个月大,而ChatGPT的出现还不到一个月吗? 打个形象的比喻,只要眨一下眼,你就会错过一个全新的行业 ...

  6. ​“从0到1手搓GPT”教程来了!李飞飞高徒出品,马斯克点赞!

    来源:量子位 "从0到1手搓GPT"教程来了! 视频1个多小时,从原理到代码都一一呈现,训练微调也涵盖在内,手把手带着你搞定. 该内容刚发出来,在Twitter已吸引400万关注量 ...

  7. 【强化学习炼金术】李飞飞高徒范麟熙解析强化学习在游戏和现实中的应用

    在新智元上一篇文章中,Jim Fan(范麟熙)介绍了强化学习的概念和目的.今天是<强化学习炼金术>Introduction第三讲. 在这一课里,Jim Fan会跟各位炼金术师们聊一聊游戏中 ...

  8. 李飞飞高徒Andrej Karpathy为大家答疑解惑

    编者按:李飞飞高徒Andrej Karpathy2015年在斯坦福大学获得计算机科学专业博士,2016进入OpenAI工作,主要研究兴趣为:深度学习,生成模型和强化学习.2011至2015年先后在Go ...

  9. 重磅!斯坦福李飞飞教授团队新研究登 Nature 子刊

    作者 | 李梅.王玥 编辑 | 陈彩娴 转自:AI科技评论 在当前 AI 模型的开发以模型为中心转向以数据为中心的趋势下,数据的质量变得尤为重要. 在以往的 AI 开发流程中,数据集通常是固定的,开发 ...

最新文章

  1. [iOS Animation]-CALayer 图层几何学
  2. vbs结束进程代码_物联网学习教程—Linux系统编程之进程控制
  3. Struts 源码分析笔记1(尚无内容-请跳过,省得浪费时间)
  4. dojo中 xhr.post向后台传参出现乱码
  5. Electron中 提示:Uncaught ReferenceError: process is not defined
  6. Vuex——使用namespace的store使用mapState获取state为undefined
  7. CountDownLatch线程同步辅助
  8. poj2513Colored Sticks(无向图的欧拉回路)
  9. 如何破解受保护的excel密码
  10. 别把可视化不当事,看完大屏模板,Excel和PPT直言比不过
  11. stringstream 字符串的格式化数据提取
  12. python框架支持套接字么_Python的框架比较:Django,金字塔,水瓶,Sanic,旋风,BottlePy等等...
  13. mc服务器资源包在什么文件夹,资源包
  14. DELL EqualLogic PS存储硬盘故障数据恢复
  15. Word2Vec之Skip-Gram与CBOW模型
  16. 元宇宙下的商人、小说家和“钢铁侠”
  17. 11个开源测试自动化框架,如何选?
  18. java web实现打印功能
  19. 浅谈变电站综合自动化系统微机综合保护装置—安科瑞 孙斌
  20. 安装win7旗舰版,一直卡在安装程序正在应用系统设置

热门文章

  1. 全国计算机二级ms2017,2017全国计算机二级MS-Office选择题题库大全
  2. java怎么让窗口居中显示图片_Java_Swing中让窗口居中显示的方法(三种方法)
  3. 鸿蒙系统开发者如何加入,鸿蒙开发实战系列之五:鸿蒙系统原生数据库
  4. 数据导入导出、备份恢复
  5. java启动项目报错,org.apache.catalina.lifecycleException..............以及解决方案
  6. XidianOJ 1090 爬树的V8
  7. 2--OC -- 类的创建与实例化
  8. js 闭包作用(转自别人的)
  9. 合理使用EntityFramework数据验证的异常错误提示信息
  10. GCC 加工程序的过程