简介

本文的作者来自浦项科技大学和首尔大学
下载链接

动机

在Grounding领域，早些的方法都可以归结为scan-and-localize framework，主要包括两个步骤：1. 生成proposals；2. 根据matching score进行选择。但是这一类方法存在很大的弊端：获得matching score的过程中，使用text query的全局特征，丢失了用于定位的细节信息。后续，有人对方法进行了改进，将此task视为注意力定位问题，通过回归解决。弊端：局限于最具有判别力的短语，没有对context进行全面的理解。

贡献

将text query分为多个短语，每个短语作为context，与video进行交互。
从局部->全局，建模视频片段和短语的关系。
实验结果，large margin。

方法

本文方法的整体框架如图所示。

实验

在Charades-STA数据集上的实验结果：

在ActivityNet Captions数据集上的实验结果：

在Charades-STA数据集上的消融实验：

CVPR 2020 《Local-Global Video-Text Interactions for Temporal Grounding》论文笔记相关推荐

CVPR 2020 | 《Learning to Transfer Texture from Clothing Images to 3D Humans》论文解读
作者和机构德国马普所,SMPL的论文也出自该单位,三作Gerard也是SMPL论文的作者解决的问题通过服装的正面和背面图实时生成3D模型动机该研究有助于3D人体渲染,生成数据以供网络学习,虚 ...
CVPR 2020 Modality Shifting Attention Network for Multi-modal Video Question Answering
动机 VQA具有挑战性,因为它需要同时使用图像和文本执行细粒度推理的能力.视频问答(VideoQA)和多模态视频问答(MVQA)都是这种需要推理的任务. 与VQA或VideoQA相比,MVQA是一项更 ...
CVPR 2017 ADNet:《 Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning》论文笔记
理解出错之处望不吝指正. 本文模型叫做ADNet.该模型通过强化学习产生动作序列(对bbox进行移动or尺度变换)来进行tracking.原理如下图(第一列代表初始帧,第二列和第三列代表通过RL产生的 ...
CVPR 2018 Siam-RPN:《High Performance Visual Tracking with Siamese Region Proposal Network》论文笔记
理解出错之处望不吝指正. 本文模型叫做Siam-RPN.本文将Siamese Network和RPN结合,提出了一种端到端的离线训练方法,并把tracking过程视为one-shot detectio ...
CVPR 2018 SINT++:《SINT++: Robust Visual Tracking via Adversarial Hard Positive Generation》论文笔记
理解出错之处望不吝指正. 本文用到了变分自编码VAE和强化学习DQN,我觉得很新颖.整体架构如下图: 首先,使用VAE来生成positive sample,如上图中右下角. 然后,使用HTPN网络将得 ...
28 篇论文、6 大主题带你一览 CVPR 2020 研究趋势
关注"迈微AI研习社",内容首发于公众号转自 | AI科技评论首度于线上召开的CVPR 2020 会议已经落下帷幕.今年,大会共有1467篇论文被接收,共举办了29个Tutor ...
CVPR 2020 论文大盘点-医学影像处理识别篇
医学影像处理识别是计算机视觉的重要方向,尽管CVPR 不是专门的医学领域学术会议,但仍有不少相关工作,CVPR 2020 中尤以医学影像分割为最. 本文盘点相关论文,总计 19 篇,其中: 医学图像分 ...
【论文阅读】CVPR 2020：GaitPart: Temporal Part-based Model for Gait Recognition
GaitPart: Temporal Part-based Model for Gait Recognition 目录 GaitPart: Temporal Part-based Model for ...
CVPR 2020 《Where Does It Exist: Spatio-Temporal Video Grounding for Multi-Form Sentences》论文笔记
目录简介动机贡献方法实验简介本文也是一篇poster,作者出自浙大.阿里巴巴和电科大. 本文提出了一个新的task--STVG(Spatio-Temporal Video Groundi ...

CVPR 2020 《Local-Global Video-Text Interactions for Temporal Grounding》论文笔记

目录

简介

动机

贡献

方法

实验

CVPR 2020 《Local-Global Video-Text Interactions for Temporal Grounding》论文笔记相关推荐

最新文章

热门文章