Scene understanding 场景理解感觉定义并不是十分明确,找了几个供参考。

LSUN Challenge 大规模场景理解比赛

INTRODUCTION
The PASCAL VOC and ImageNet ILSVRC challenges have enabled significant progress for object recognition in the past decade. Beginning with CVPR 2015, we borrowed this mechanism to speed up the progress for scene understanding via the LSUN workshop. Complementary to the object-centric ImageNet ILSVRC Challenge hosted at ICCV/ECCV every year, we propose to continue hosting this scene-centric challenge at CVPR every year. Our challenge will focus on major tasks in scene understanding, including scene object retrieval, outdoor scene segmentation, RGB-D 3D object detection and saliency prediction. Inspired by recent successes using big data, such as deep learning, we focus on providing benchmarks that are significantly bigger and more diverse than the existing ones, to support training these data-hungry algorithms. By providing a set of large-scale benchmarks in an annual challenge format, we expect significant progress to continue for scene understanding in the coming years. Given the experience of our previous workshops, we are updating all of our existing tasks and rolling out new tasks.
链接 http://lsun.cs.princeton.edu/2017/
从这个比赛的介绍可以看出,场景理解主要关注的任务有

  • scene object retrieval 场景目标检索
  • outdoor scene segmentation 室外场景分割
  • RGB-D 3D object detection RGB-D 3D 目标检测
  • saliency prediction 显著性预测

综述Computer Vision for Autonomous Vehicles: Problems, Datasets and State-of-the-Art

论文链接 https://arxiv.org/pdf/1704.05519.pdf
在这篇综述的第10章中,对于场景理解是这样描述的
One of the basic requirements of autonomous driving is to fully understand its surrounding area such as a complex traffic scene. The complex task of outdoor scene understanding involves several sub-tasks such as depth estimation, scene categorization, object detection and tracking, event categorization, and more. Each of these tasks describe particular aspect of a scene. It is beneficial to model some of these aspects jointly to exploit the relations between different elements of the scene and obtain a holistic understanding. The goal of most scene understanding
models is to obtain a rich but compact representation of the scene including all its elements e.g., layout elements, traffic participants and the relations with respect to each other. Compared to reasoning in the 2D image domain, 3D reasoning plays a significant role in solving geometric scene understanding problems and results in a more informative representation of the scene in the form of 3D object models, layout elements and occlusion relationships. One specific challenge in scene understanding is the interpretation of urban and sub-urban traffic scenarios. Compared to highways and rural roads, urban scenarios comprise many independently moving traffic participants, more variability in the geometric layout of roads and crossroads, and an increased level of difficulty due to ambiguous visual features and illumination changes.
可以看出,在这里,户外场景理解(面向自动驾驶领域的)包括几个子任务:

  • 深度估计
  • 场景分类
  • 目标检测和跟踪
  • 事件分类

MIT 自动驾驶公开课

里面第三次课提到了,场景理解是自动驾驶需要解决的几大任务(定位与建图,场景理解,运动规划,驾驶员状态)之一。
可以直观理解成为Where is someone else?
其中提到的例子主要有
- 关于目标检测的
- 关于驾驶全场景分割的,比如说SegNet
- 从音频数据得到路况信息,分析路面纹理特征等

Lecun的一个ppt

看到lecun关于深度学习和场景理解的一个ppt
里面大概是这样理解场景理解

  • 目标检测
  • 语义分割
  • 场景解析和标注 Scene Parsing and Labelling

国内论文

自动化学报上的
目前视觉场景理解还没有严格统一的定义.参考麻省理工、卡耐基梅隆、斯坦福等大学的国际著名科研团队的研究工作[2−4],视觉场景理解可表述为在环境数据感知的基础上,结合视觉分析与图像处理识别等技术手段,从计算统计、行为认知以及语义等不同角度挖掘视觉数据中的特征与模式,从而实现场景有效分析、认知与表达.近年来结合数据学习与挖掘、生物认知特征和统计建模方法构建的视觉场景认知理解系统。

读都没读顺……

关于scene understanding场景理解概念的理解相关推荐

  1. 图像分类经典卷积神经网络—ZFNet论文翻译(中英文对照版)—Visualizing and Understanding Convolutional Networks(可视化和理解卷积网络)

    图像分类经典论文翻译汇总:[翻译汇总] 翻译pdf文件下载:[下载地址] 此版为中英文对照版,纯中文版请稳步:[ZFNet纯中文版] Visualizing and Understanding Con ...

  2. Visualizing and Understanding Convolutional Networks - 可视化和理解卷积网络 - 看懂卷积网络

    Visualizing and Understanding Convolutional Networks 可视化和理解卷积网络 - 看懂卷积网络 Matthew D Zeiler, Rob Fergu ...

  3. Spring Security 实战干货: RBAC权限控制概念的理解

    点击上方蓝色"程序猿DD",选择"设为星标" 回复"资源"获取独家整理的学习资料! 作者 | 码农小胖哥 来源 | 公众号「码农小胖哥」 1 ...

  4. 白翔:复杂开放场景中的文本理解

    编者按:李白的<秋浦歌>中有这样一句诗:"题诗留万古,绿字锦苔生",描绘了天执笔.地做纸.苔为墨,挥毫题字的豪迈场景,也展示了自然场景中文本类型的多样性:而另两句&qu ...

  5. jar包等概念的理解、yaml语法学习和多环境切换

    一.学习内容 jar包等概念的理解 yaml语法学习 多环境切换 1.jar包等概念的理解 这部分的学习内容是关于一些名词的解释,这些名词是我在看课过程中,听到或看到却又未曾了解的.因为不理解这些名词 ...

  6. Revit坐标系概念深入理解及应用:内部点、原点、项目基点、测量点、共享坐标系、地理坐标及之间关系和衍生概念操作(详细)

    1. 概述 Revit 提供了多种方法来定义模型的关联环境.包括内部点.原点.项目基点.测量点.共享坐标系.地理坐标以及与定位概念相关的的距离限制.多模型协作.项目北.正北等概念:这些概念多而复杂,相 ...

  7. CNN交通场景解析--Spatial as Deep: Spatial CNN for Traffic Scene Understanding

    Spatial as Deep: Spatial CNN for Traffic Scene Understanding AAAI 2018 https://github.com/cardwing/C ...

  8. 架构漫谈(二):认识概念是理解架构的基础

    原文:架构漫谈(二):认识概念是理解架构的基础 架 构漫谈是由资深架构师王概凯Kevin执笔的系列专栏,专栏将会以Kevin的架构经验为基础,逐步讨论什么是架构.怎样做好架构.软件架构如何落地.如 何 ...

  9. BlockChain:区块链技术基础概念综合理解——个人总结

    BlockChain:区块链技术基础概念综合理解--个人总结 目录 区块链的进阶与意义 1.区块链技术的进阶 2.区块链技术三大意义-传递价值.建立可信用环境.提高效率和降低成本 1.传递价值 2.建 ...

最新文章

  1. Android深度探索读后感第二章
  2. Nacos OPEN API配置管理测试
  3. 垃圾收集算法,垃圾收集器_为什么我不能关闭垃圾收集器?
  4. flowgraph java_如何在TensorFlow import_graph_def期间更改输入的维度
  5. 软件架构(9)---UML 图
  6. 在安卓手机上编写和运行Python 3.x程序
  7. mikumikudance
  8. mPush实战笔记4安装mpush
  9. 水果生鲜类抖音号被大量封号
  10. Django 文档 -- 记录我的Django学习之旅
  11. 面试被问到这道送命题,怎么回答才不会变成炮灰
  12. 手把手教你用EZDML批量生成vue-element-admin前端页面代码
  13. 直播和短视频的区别以及直播能带来什么效果?
  14. vscode的下载与安装教程
  15. Java 第9 章 : 数据表与简单Java类映射转换
  16. python爬取bilibili数据_如何使用Python爬取bilibili视频(详细教程)
  17. linux 中read命令后面-p是什么意思呢
  18. AS基本使用总结之从svn导入eclipseADT项目
  19. 分页利器——pageHelper分页插件
  20. 路由器的LAN口和WAN口有什么区别

热门文章

  1. 太牛逼了,Python和算法简直是绝配
  2. 用户体验设计师常用的21款工具和应用
  3. 几招就可轻松搞定证件照处理,还不快来码住!
  4. 点击评论区让键盘弹起uni-app
  5. 计算机工作无法更改,win10系统计算机工作组名称无法更改的操作方案
  6. python作业:有一个学生成绩表,包括学号、姓名、高数、英语,计算机。 录入若干个学生学号、姓名、高数、英语,计算机5项数据。 将学生成绩表数据写入文件,文件名为“学生成绩表.txt
  7. 天眼探空经济发展_前沿|“天眼”探空惊艳全球
  8. [CTO札记]武侠人物名称稀缺,上起点找吧
  9. 一个女孩写给monica信 转贴
  10. mac外接显示器 竖屏 黑苹果_借人气问一个黑苹果外接显示器的问题