在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考。

在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果。

点击本文底部的「阅读原文」即刻加入社区,查看更多最新论文推荐。

这是 PaperDaily 的第 52 篇文章

关于作者:陈泰红,小米高级算法工程师,研究方向为人脸检测识别,手势识别与跟踪。

■ 论文 | Parallel Tracking and Verifying

■ 链接 | https://www.paperweekly.site/papers/1613

■ 源码 | http://tinyurl.com/y94wn2yg

论文动机

目标追踪是视频分析的基本任务,比目标识别更为复杂:目标追踪可以把每一帧看作单独的图片,再进行识别,但目标追踪不会这样做,因为没有考虑视频帧之间的冗余信息,效率低且慢。

目标追踪一直有两大阵营,CF 相关滤波和 CNN,当然也可以 CF+CNN 融合。

本文基于以下动机:

1. 物体运动时,大部分时间运动平缓,外观改变较慢。但是对于偶然发生的剧烈运动,需要复杂信息处理,需要单独验证。

2. CV 领域已经普及多线程计算,尤其 SLAM(Simultaneous localization and mapping、同步定位于地图构建)领域。PTAM 算法的一个关键观点是每一帧不是有必要构建地图。对于目标追踪而言,每一帧图片也不需要单独的验证。

3. tracking performance 和 efficiency 之间需要达到一种平衡。

论文将 tracking 过程分解为两个并行但是相互协作的部分:一个用于快速的跟踪(fast tracking),另一个用于准确的验证(accurate verification)。

其实作者之前发布的论文版本 [1] 已被 ICCV 2017 录用,此版本在原文基础上做了进一步的修订。本文所有讨论以 2018 年 1 月 在 arXiv 上发布的版本为准

该版本在原文基础上做了以下改进:

1. 使用更具有鲁棒性的跟踪器(Staple)提升性能。

2. 动态目标模板池用于自适应验证,放置目标外观的变化。

3. PTAV 的 V 和 T 进行了多方面验证,比如 T 使用 VGGNet 和 AlexNet ,V 使用 KCF、fDSST 和 Staple。

4. 使用更多实时性算法和基准,进行更彻底实验验证和分析。

论文模型


PTAV 算法架构包括三部分:Base Tracker T,Base Verifier V,以及它们之间的协调环节。

对于 T,论文选择的是 Staple 算法 [2]。验证环节 V 则选择采用 Siamese network 验证目标之间的相似性。对于协调环节,T 在合适的频率发送结果给 V,保证足够的时间验证。

为了改善 PTAV 的精度和速率,论文使用 k 均值聚类用于保持动态目标模板池用于自适应验证。

实验

论文的实验数据详实,在主要数据集 OTB2015,TC128,UAV20L 和 VOT2016 上均和典型算法进行了对比。

从精度和实时性考虑各个模型,如图所示,OTB2015 数据集显示效果。

总结

PTAV 的假设是大部分时间目标运动平滑,位置改变很慢。而较难的情况是运动的无规律性。论文提出的 verifying 时刻并不一定是运动改变的时刻,具有偶然性,所以对“打架斗殴”等运动剧烈的情况会失败。10 帧更新速率对 verifying 不是最好的选择。

对于同样视频序列处理的 video segmentation,可以同样考虑。因为视频的逐帧操作比较耗费时间,这种间隔性的验证可大量节约资源。但是,对于剧烈变化的活动,更新会滞后。是否存在自使用速率变化的方法,这样的坑可以继续填。

参考文献

[1] Parallel Tracking and Verifying: A Framework for Real-Time and High Accuracy Visual Tracking (ICCV2017)

[2] Staple: Complementary Learners for Real-Time Tracking

本文由 AI 学术社区 PaperWeekly 精选推荐,社区目前已覆盖自然语言处理、计算机视觉、人工智能、机器学习、数据挖掘和信息检索等研究方向,点击「阅读原文」即刻加入社区!

#榜 单 公 布 #


2017年度最值得读的AI论文 | NLP篇 · 评选结果公布

2017年度最值得读的AI论文 | CV篇 · 评选结果公布


  我是彩蛋 


解锁新功能:热门职位推荐!

PaperWeekly小程序升级啦

今日arXiv√猜你喜欢√热门职位

找全职找实习都不是问题

 解锁方式 

1. 识别下方二维码打开小程序

2. 用PaperWeekly社区账号进行登陆

3. 登陆后即可解锁所有功能

 职位发布 

请添加小助手微信(pwbot01)进行咨询

长按识别二维码,使用小程序

*点击阅读原文即可注册


关于PaperWeekly


PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。

▽ 点击 | 阅读原文 | 查看原论文

PTAV:实时高精度目标追踪框架 | ICCV 2017论文解读相关推荐

  1. CycleGAN:图片风格,想换就换 | ICCV 2017论文解读

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  2. ICCV 2019 论文解读 | 基于层次解析的Image Captioning

    ©PaperWeekly 原创 · 作者|蔡文杰 学校|华南理工大学 研究方向|计算机视觉 目前大多数的 image captioning 模型采用的都是 encoder-decoder 的框架.本文 ...

  3. YOLOv7:无需预训练模型的最新最实时的目标检测框架

    Yolov7论文翻译 翻译工具: DeepL和 讯飞文档翻译 论文:https://arxiv.org/abs/2207.02696 代码:https://github.com/WongKinYiu/ ...

  4. ICCV 2019 论文解读:用图神经网络改善视频的多标签分类

    作者 | 王磊 本文介绍了汽车之家团队在ICCV 2019一篇关于视频理解论文相关的工作.针对视频多标签分类的问题,论文提出了将视频多标签之间相关性特征加入到网络之中,结果证明该方法可以显著的提高视频 ...

  5. NIPS 2017论文解读 | 基于对比学习的Image Captioning

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  6. (目标检测)Faster R-CNN 论文解读+复现

    Faster R-CNN xyang 声明:本篇文章借用了他人理解,如有侵权,请联系,另如需转载,请注明出处 关于最新最全的目标检测论文,可以查看awesome-object-detection &l ...

  7. 直播实录 | 基于生成模型的事件流研究 + NIPS 2017 论文解读

    本文为 12 月 20 日,约翰霍普金斯大学 CLSP 实验室博士生--梅洪源博士在第 20 期 PhD Talk 中的直播分享实录. 本期 PhD Talk,来自约翰霍普金斯大学 CLSP 实验室的 ...

  8. 阿里NIPS 2017论文解读:如何降低TensorFlow训练的显存消耗?

    阿里妹导读:被誉为国际顶级的机器学习和神经网络学术会议NIPS 2017于12月4日-9日在美国加州长滩市举行.在本届会议上,阿里巴巴除有两篇论文入选Workshop并进行Oral和Poster形式报 ...

  9. 目标检测算法Faster R-CNN论文解读

    论文题目:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 论文地址:https://arx ...

最新文章

  1. CV之后,纯MLP架构又来搞NLP了,性能媲美预训练大模型
  2. 旋转矩阵与欧拉角之间的转换
  3. Spring整合JMS(四)——事务管理
  4. DNS通道检测 国外学术界研究情况——研究方法:基于流量,使用机器学习分类算法居多,也有使用聚类算法的;此外使用域名zif low也有...
  5. python flask 路由_python框架之Flask(2)-路由和视图Session
  6. Crawler:基于BeautifulSoup库+requests库实现爬取2018最新电影《后来的我们》热门短评
  7. Jfinal碰到的问题记录
  8. Nginx开启SSL支持实例配置
  9. docker rabbitmq_Docker部署RabbitMQ集群
  10. 使用cronolog自动分割apache的日志。
  11. NYOJ题目71-独木舟上的旅行(贪心)
  12. 前端入门: 用css设置文字样式
  13. 打开计算机不显示磁盘盘符,移动硬盘盘符不显示如何修复
  14. 力扣刷题 DAY_74 回溯
  15. 如何运营好微信公众号?如何利用微信公众号盈利?
  16. 记录在处理SIF数据中,遇到的一些问题及解决过程
  17. 模仿百思不得姐项目开发总结
  18. (已解决)ubuntu16.04蓝牙耳机与电脑配对成功,但不出现在声音输出设备里
  19. 「NFT 之王」无聊猿与品牌的跨界营销!
  20. 诺基亚获得首个5G大规模订单,全球正式开启5G争夺战!

热门文章

  1. 小程序动态设置style,使用内部数据
  2. spring零碎知识点(二)
  3. Fiddler二次开发 C#
  4. hdu 2049 不容易系列之(4)——考新郎
  5. JSON 分析数据格式
  6. c# namespace不能和class的name 相同
  7. 计算机房活动记录,兴趣小组活动记录表
  8. ecs服务器内网连接_让不同地域云服务器ECS和云数据库内网互通
  9. linux安装python3_关于在linux系统中python第三库的区分和查找
  10. hive explode