目录

UNT(UntrimmedNets)

I3D(Inflated 3D ConvNet)

总结


UNT(UntrimmedNets)

论文地址:https://openaccess.thecvf.com/content_cvpr_2017/papers/Wang_UntrimmedNets_for_Weakly_CVPR_2017_paper.pdf

全名《UntrimmedNets for Weakly Supervised Action Recognition and Detection》。该论文是一篇CVPR2017年的论文。

现有的行为识别方法严重依赖于剪切过的视频数据来训练模型,然而,获取一个大规模的剪切过的视频数据集需要花费大量人力和时间。因此,我们提出了弱监督的网络结构UntrimmedNets,它能直接使用未剪切的视频进行学习,而不需要时序标注。

参考链接:[论文笔记]UntrimmedNet:弱监督行为识别与检测网络(CVPR 2017) - 知乎


I3D(Inflated 3D ConvNet)

论文地址:https://arxiv.org/pdf/1705.07750.pdf

全名《Quo Vadis,Action Recognition? A New Model and the Kinetics Dataset》。该论文是一篇CVPR2018年的论文。

使用了新的数据集Kinetics重新评估了当前最新的模型架构,Kinetics数集有400个人体行为类别,每个类别有400多个clips,这些数据来自真实有挑战的YouTube视频。作者提出的双流膨胀3D卷积网络(I3D),该网络是对一个非常深的图像分类网络中的卷积和池化kernel从2D扩展到了3D,来无缝的学习时空特征。并且模型I3D在Kinetics预训之后,I3D在基准数据集HMDB-51和UCF-101达到了80.9%和98.0%的准确率。


参考链接:https://blog.csdn.net/weixin_44402973/article/details/94396298


总结

通常使用I3D提取双流特征,得到的结果会好一些,一方面主要因为网络结构更深,另一方面使用3d卷积核,将时序信息包含进来,能提取更完备的视频特征。 UntrimmedNets是用采样的方法,使用2d网络提取特征。

时序动作定位 | I3D(Inflated 3D ConvNet) 与 UNT(UntrimmedNets) 特征模型相关推荐

  1. CVPR 2021 | 腾讯优图20篇论文入选,含人脸识别、时序动作定位、视频动作分割等领域...

    编辑丨腾讯优图AI开放平台 计算机视觉世界三大顶会之一的CVPR 2021论文接收结果出炉!本次大会收到来自全球共7015篇有效投稿,最终有1663篇突出重围被录取,录用率约为23.7%.本次,腾讯优 ...

  2. 百度飞将BMN时序动作定位框架 | 数据准备与训练指南 (上)

    一.介绍 BMN模型是百度自研,2019年ActivityNet夺冠方案,为视频动作定位问题中proposal的生成提供高效的解决方案. 简单说,视频的时序动作定位就是给一段视频,分析出从xxx秒到x ...

  3. 时序动作定位:Rethinking the Faster R-CNN Architecture for Temporal Action Localization(TAL-Net)

    这篇是2018CVPR的文章,论文下载链接: http://cn.arxiv.org/pdf/1804.07667.pdf 1 背景 1.1 Faster R-CNN vs TAL-Net 得益于Fa ...

  4. 时序动作定位 | 面向时序行为定位任务的无监督预训练

    ​论文链接:https://arxiv.org/abs/2203.13609 代码地址:https://github.com/zhang-can/UP-TAL 主要贡献: 首次面向时序行为定位任务进行 ...

  5. 时序动作定位 | ActionFormer: 使用Transformers动作时刻

    目录 ActionFormer: Localizing Moments of Actions with Transformers 摘要 3 ActionFormer: A Simple Transfo ...

  6. ICCV2021 新增数据集汇总 | 含时序动作定位、时空行为检测、弱光目标检测等!...

    点击下方"计算机视觉联盟",一起进步!重磅干货,第一时间送达 ICCV 2021 数据集汇总 https://github.com/DWCTOD/ICCV2021-Papers-w ...

  7. SCNN-用于时序动作定位的多阶段3D卷积网络

    转自:http://blog.csdn.net/wzmsltw/article/details/65437295 注:本文首发在微信公众号-极市平台.如需转载,请联系微信Extreme-Vision ...

  8. 时序动作定位 | RSKP:基于代表片段知识传播的弱监督时间动作定位(CVPR 2022)

    关于<Weakly Supervised Temporal Action Localization via Representative Snippet Knowledge Propagatio ...

  9. 时序动作定位|使用 ‘注意力机制’ 的弱监督时序动作定位顶会论文理解笔记(Weakly-Supervised Temporal Action Localization)

    目录 Weakly Supervised Action Localization by Sparse Temporal Pooling Network(CVPR 2018) W-TALC: Weakl ...

  10. 动作定位、检测与理解,ICCV 2021 DeeperAction挑战赛开启~

    本次ICCV 2021的DeeperAction挑战赛旨在推动人类动作理解领域研究从传统的动作识别转向更深入的动作理解任务,希望模型能够在不同视频中对人类动作的进行定位和详细理解. 具体来说,组织者提 ...

最新文章

  1. 嵌入式linux内核编译感想,嵌入式Linux内核的交叉编译编译-基于2.6.26
  2. android比较常用的布局,Android_九宫图比较常用的多控件布局(GridView)使用介绍,GridView跟ListView都是比较常用的 - phpStudy...
  3. 单片机小白学步系列(七) 准备实验板——萝卜青菜,各有所爱
  4. requestAnimationFram
  5. 京东上市了,员工有多少股票? .
  6. 360 java插件设置_jdk环境变量一键设置 管理員运行
  7. layuiajax提交表单控制层代码_无代码搭建系统(一)——流程表单搭建
  8. 生成dump文件需要多久_php8的扩展arginfo生成工具
  9. csgo自动选择服务器,CSGO服务器怎么选择合适的配置?CSGO服务器如何选择系统?...
  10. Android 四大组件学习之BroadcastReceiver四
  11. 【计算机组成与设计学习笔记】(一)
  12. VSTO程序基本知识(二)
  13. 代理ip按功能分哪几类?
  14. 户型图纸上3D房子生长动画LOGO展示PR片头模板
  15. unity 遮挡剔除
  16. 用这个抢票神器,一抢一个准!
  17. ansible service 模块
  18. 分布式事务(三):分布式事务解决方案之TCC(Try、Confirm、Cancel)
  19. Linux学习(五):挂载新的硬盘
  20. 微信开发(八)自动回复和多客服开发

热门文章

  1. 有关matlab裁剪图片方面
  2. Ipad项目中用到的UIModalPresentationFormSheet,点击阴影部分dismiss 当前presented的controller
  3. Unity3D实现3D立体游戏原理及过程,需偏振眼镜3D显
  4. Win10方便快捷键
  5. 5GC 网元介绍(AMF、SMF、UPF、UDM、PCF)
  6. 中企动力助力亚美日化 打造互联网一站式综合服务平台
  7. 鸿蒙系统am,解读鸿蒙“碰一碰”黑科技以全领域为亚美AM8发展目标
  8. mysql创建用户临时表_mysql创建与删除临时表实例
  9. unbuntu 安装node
  10. RTKLIB-学习笔记