论文浏览(42) Action Genome: Actions as Composition of Spatio-temporal Scene Graphs
文章目录
- 0. 前言
- 1. 要解决什么问题
- 2. 用了什么方法
- 3. 效果如何
- 4. 还存在什么问题&有什么可以借鉴
0. 前言
- 相关资料:
- arxiv
- github
- 官网
- 论文解读
- 论文基本信息
- 领域:时空行为检测
- 作者单位:斯坦福大学
- 发表时间:CVPR 2020
1. 要解决什么问题
- 在计算机视觉中,我们将行为(actions or activities)作为一个完整的整体。
- 但其实在认知科学(Cognitive Science)和神经学的研究中发现,人的行为被编码为一个 hierarchical part structures。
2. 用了什么方法
- 提出了一个数据集(其实是在Charades的基础上进行再标注):
- 将行为看作是 Action Genome(行为基因组)
- 即,将行为分解为时空场景图(spatio-temporal scene graphs)。
- 捕捉行为发生时,人与物体之间的关系。
- 常见数据集对比
- 所谓关系,如下图所示
- Charades中所谓的relation,指的是clip level的
- Action Genome中的relation是 image-level 的
- 人周边物体有很多,参考下图
- 说是提出了一种结构 SGFB 来处理,没细看
3. 效果如何
- 通过Action Genome可实现普通Charades分类,few-shot任务以及Spatio-temporal scene graph prediction
4. 还存在什么问题&有什么可以借鉴
这数据集好是好,但感觉要用到实际应用中比较麻烦……需要后续研究下细节。
论文浏览(42) Action Genome: Actions as Composition of Spatio-temporal Scene Graphs相关推荐
- Charades CharadesEgo Action Genome 数据集以及论文总结
0. 前言 本文介绍Charades系列数据集,包括: Charades:ECCV 2016,第一个家庭室内场景下的日常行为识别数据集,是通过众包完成的. 数据集采集方式挺有意思,用户先写剧本(根据关 ...
- ICCV2017 论文浏览记录(转)
mark一下,感谢作者分享! 作者将ICCV2017上的论文进行了汇总,在此记录下来,平时多注意阅读积累. 之前很早就想试着做一下试着把顶会的论文浏览一遍看一下自己感兴趣的,顺便统计一下国内高校或者研 ...
- ICCV2017 论文浏览记录
之前很早就想试着做一下试着把顶会的论文浏览一遍看一下自己感兴趣的,顺便统计一下国内高校或者研究机构的研究方向,下面是作为一个图像处理初学者在浏览完论文后的 觉得有趣的文章: ICCV2017 论文浏览 ...
- image generation from scene graphs 论文+code复现总结
image generation from scene graphs 论文+code复现总结 abstraction 传统方法在一些限制好的领域像鸟或花,这些方法都还不错,但是在如实地分解复杂的段落为 ...
- 论文翻译-Hamming OCR A Locality Sensitive Hashing Neural Network for Scene Text Recognition
论文翻译-Hamming OCR A Locality Sensitive Hashing Neural Network for Scene Text Recognition 原文地址:https:/ ...
- 论文阅读:Question Answering Over Temporal Knowledge Graphs
论文阅读:Question Answering Over Temporal Knowledge Graphs 我们首先在我们的新数据集上应用大型预训练的基于 LM 的 QA 方法. 然后,我们将时间和 ...
- 论文浏览(38) Tube Convolutional Neural Network (T-CNN) for Action Detection in Videos
文章目录 0. 前言 1. 要解决什么问题 2. 用了什么方法 3. 效果如何 4. 还存在什么问题&有什么可以借鉴 0. 前言 相关资料: arxiv github(CAFFE) 论文解读 ...
- 论文阅读 Current Solutions for Web Service Composition
简单信息 Title Current solutions for Web service composition Journal IEEE Internet Computing Year 2004 A ...
- 论文浏览(27) Long-Term Feature Banks for Detailed Video Understanding
文章目录 0. 前言 1. 要解决什么问题 2. 用了什么方法 3. 效果如何 4. 还存在什么问题&可借鉴之处 0. 前言 相关资料: arxiv github 论文解读 论文基本信息 领域 ...
- 论文浏览(11) A Multigrid Method for Efficiently Training Video Models
文章目录 0. 前言 1. 要解决什么问题 2. 用了什么方法 3. 效果如何 4. 还存在什么问题 0. 前言 相关资料: arxiv github 论文解读 论文基本信息 领域:视频理解 训练加速 ...
最新文章
- linux做网卡bond,linux下设置网卡bond
- Spring MVC前后端的数据传输
- Unicode,UTF-32,UTF-16,UTF-8到底是啥关系?
- python中的[:-1] [:,:-1] python矩阵numpy中array的冒号 逗号
- 光纤跳线接口的种类及适用范围
- 多层mvc,thikphp进阶
- C#中Json字符串的各种应用类
- 二维稳态热传导 代码实现_博世壁挂炉发生故障代码及处理办法
- docker omv 防火墙_OpenMediaVault(OMV)配置Docker
- ***error*** (zip#Browse) unzip not available on your system
- django-celery beat报错 error pid
- DOM-基本概念及使用
- Springboot @Validated和@Valid
- 深入理解SpringBoot启动机制(starter机制)
- win7简单命令让PC变身无线热点,共享M9上网
- 数组常用方法 (es4,es5,es6)
- 微信公众号文章采集的几种方案
- Golang的文件处理方式-常见的读写
- 如何查询澳大利亚药监局(TGA)药品信息数据
- STM32F051用jlink V8进行调试设置MDK环境buc