点上方蓝字计算机视觉联盟获取更多干货

在右上方 ··· 设为星标 ★,与你不见不散

仅作分享,不代表本公众号立场,侵权联系删除

转载于:AI科技评论

AI博士笔记系列推荐

周志华《机器学习》手推笔记正式开源!可打印版本附pdf下载链接

行人检测作为计算机视觉领域最基本的主题之一,多年来被广泛研究。尽管最先进的行人检测器已在无遮挡行人上取得了超过 90% 的准确率,但在严重遮挡行人检测上依然无法达到满意的效果。究其根源,主要存在以下两个难点:

1、严重遮挡的行人框大部分为背景,检测器难以将其与背景类别区分;

2、给定一个遮挡行人框,检测器无法得到可见区域的信息;

针对这两大难题,地平线与 Buffalo 学院提出 Tube Feature Aggregation Network(TFAN)新方法,即利用时序信息来辅助当前帧的遮挡行人检测,目前该方法已在 Caltech 和 NightOwls 两个数据集取得了业界领先的准确率。

相关论文「Temporal-Context Enhanced Detection of Heavily Occluded Pedestrians」已被收录于 CVPR 2020 。

论文链接:https://cse.buffalo.edu/~jsyuan/papers/2020/TFAN.pdf

1、核心思路

利用时序信息辅助当前帧遮挡行人检测

目前大部分行人检测工作都集中于静态图像检测,但在实际车路环境中大部分目标都处于运动状态。针对严重遮挡行人的复杂场景,单帧图像难以提供足够有效的信息。为了优化遮挡场景下行人的识别,地平线团队提出通过相邻帧寻找无遮挡或少遮挡目标,对当前图像中的遮挡行人识别进行辅助检测。

2、实验新方法

Proposal tube 解决严重遮挡行人检测

如下图,给定一个视频序列,首先对每帧图像提取特征并使用 RPN(Region Proposal Network)网络生成 proposal 框。从当前帧的某个 proposal 框出发,依次在相邻帧的空间邻域内寻找最相似的proposal框并连接成 proposal tube。

在相邻的第 i 帧和第 i-1 帧之间,具体两个 proposal 的匹配准则可根据以下公式:

其中 s() 是用于计算两个 proposal 特征的余弦相似度,而 l() 是用于计算两个 proposal 在尺寸大小及空间位置上的相似程度(具体公式可见论文)。X 和 b 分别表示 proposal 特征和 proposal 边界框,字母的上标表示 proposal 编号,Qki-1 表示在第 i-1 帧搜索区域内的 proposal 框的编号集合。

假设视频序列共有 13 帧,可以得到一个具有 13 个 proposal 框的 tube 以及他们对应的 proposal 特征。这样的做法可以有效的将时序上前后存在的无遮挡行人连接到 proposal tube 当中。随后,将这些 proposal 特征以加权求和的方式融合到当前帧的 proposal 特征中来,具体的融合权重可根据以下公式求得:

其中,τ 代表时序上前后各有 τ 帧,λ 为常数,t 表示当前帧。公式 5 的做法可以避免无关的特征被错误融合进来。当背景框被连接到了行人的 tube 当中,他们的特征相似度较低,所以最后产生的融合权重较小,从而防止了行人特征被背景特征所污染,反之亦然。最后,我们将融合后的特征送入分类器,从而更好的识别严重遮挡的行人。

TDEM模块有效避免行人框与背景框交叉

为了避免连接 tube 过程中发生错误的偏移,比如行人框连到了背景框,或背景框连到了行人框。针对这种情况,研究团队提出 TDEM(Temporally Discriminative Embedding Module)模块用于将原 proposal 特征映射到一个 embedding 空间,然后利用 embedding 特征来计算两个 proposal 之间的特征相似度。在这个 embedding 空间我们可利用损失函数来进行监督,使行人的 embedding 与前后帧背景的 embedding 相互排斥与前后帧行人的embedding相互吸引。具体的损失函数由 triplet loss 实现如下:

其中 en,ep,et^kt*分别代表前后帧背景,行人和当前帧行人的 embedding 特征。根据实验发现 TDEM 模块可以有效的避免行人框与背景框错误的相连(参见原文表 3 及图 5)。

利用 PRM 模块解决融合权重较少的问题

即使通过以上的设计能够使得当前帧遮挡行人连接上前后帧未遮挡的行人,依然又一个亟待解决的难题:融合权重。由下图(a)可见,因为遮挡行人的特征充斥大量背景,所以遮挡行人的特征和无遮挡行人的特征相似度较低,产生的融合权重较小。因此即便找到了未遮挡行人,也很难有效地将其利用。

为了解决此问题,研究团队提出了 PRM(Part-based Relation Module)模块。在 PRM 模块中,首先预测当前帧行人的可见区域位置。然后,在比较两个行人框特征的相似度时,只会计算在这个可见区域内的相似度。如下图(a)右,当只比较两个行人的上半身相似度时,我们会发现他们其实是同一个人,由此产生的融合权重会较高。图 7 显示了 PRM 的可视化结果,我们发现 PRM 模块计算的相似度会比直接使用全身特征计算的相似度更高。

3、实验结果

TFAN 有效增强检测器的识别能力

在 Caltech 数据集上的结果如下:

注:R 表示 Reasonable 少量遮挡及无遮挡的结果,HO 表示 Heavily Occlusion 严重遮挡的结果,R+HO 表示综合结果。

可视化结果如下:

end

这是我的私人微信,还有少量坑位,可与相关学者研究人员交流学习 

目前开设有人工智能、机器学习、计算机视觉、自动驾驶(含SLAM)、Python、求职面经、综合交流群扫描添加CV联盟微信拉你进群,备注:CV联盟

王博的公众号,欢迎关注,干货多多

王博的系列手推笔记(附高清PDF下载):

博士笔记 | 周志华《机器学习》手推笔记第一章思维导图

博士笔记 | 周志华《机器学习》手推笔记第二章“模型评估与选择”

博士笔记 | 周志华《机器学习》手推笔记第三章“线性模型”

博士笔记 | 周志华《机器学习》手推笔记第四章“决策树”

博士笔记 | 周志华《机器学习》手推笔记第五章“神经网络”

博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(上)

博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(下)

博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(上)

博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(下)

博士笔记 | 周志华《机器学习》手推笔记第八章(上)

博士笔记 | 周志华《机器学习》手推笔记第八章(下)

博士笔记 | 周志华《机器学习》手推笔记第九章

点个在看支持一下吧

CVPR2020 | 遮挡也能识别?地平线提出用时序信息提升行人检测准确度相关推荐

  1. 遮挡也能识别?地平线提出时序信息提升行人检测准确度|​CVPR 2020

    来源 | 驭势科技 行人检测作为计算机视觉领域最基本的主题之一,多年来被广泛研究.尽管最先进的行人检测器已在无遮挡行人上取得了超过 90% 的准确率,但在严重遮挡行人检测上依然无法达到满意的效果.究其 ...

  2. CVPR 2020 论文大盘点-行人检测与重识别篇

    本文盘点CVPR 2020 所有行人检测(Pedestrian Detection)与人员重识别(Person Re-Identification,ReID)相关论文,在视频监控领域该方向技术应用广泛 ...

  3. 行人重识别(1)——行人检测综述

    !转载请注明原文地址!--东方旅行者 更多行人重识别文章移步我的专栏:行人重识别专栏 本文目录 一.行人检测常用方法 1.基于运动检测的方法 1) 思路 2) 存在问题 3) 原因 2.基于传统机器学 ...

  4. ECCV 2018 | Bi-box行人检测:‘行人遮挡’为几何?

    极市平台是专业视觉算法平台,主要为开发者提供真实项目需求,视觉算法开发等服务,点击填表加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会 ...

  5. 「技术综述」如何降低遮挡对人脸识别的影响

    https://www.toutiao.com/a6711562985187312131/ 作者 | 刘东平.谢远伦.言有三 编辑 | 言有三 人脸识别技术都是基于人脸关键特征提取对比完成识别的,其中 ...

  6. 如何降低遮挡对人脸识别的影响

    刘东平 重庆工商大学,本科 谢远伦 贵州大学,本科 言有三 毕业于中国科学院,计算机视觉方向从业者,有三工作室等创始人 作者 | 刘东平.谢远伦.言有三 编辑 | 言有三 人脸识别技术都是基于人脸关键 ...

  7. AI安检:北航提出安检场景下的危险品检测基准和去遮挡注意力模块

    ©作者 | 尉言路.陶仁帅 学校 | 北京航空航天大学 研究方向 | 目标检测.小样本学习 随着公共交通枢纽中人群密度的不断增加,安全检查在保护公共空间免受恐怖主义等安全威胁方面的作用越来越重要.安检 ...

  8. 怎样降低遮挡对人脸识别的影响,人脸图像算法研究(3)

    人脸识别技术都是基于人脸关键特征提取对比完成识别的,其中,特征的完整性是算法成败的一个极为关键的因素,但是当受到外界干扰较多,外界的条件发生明显变化的时候,由于传统方法过于依赖明显的.完整的图像特征, ...

  9. AI芯片评测如何与时俱进?地平线提出全新MAPS评测方法,帮助用户理解AI芯片性能...

    允中 发自 凹非寺 量子位 编辑 | 公众号 QbitAI AI芯片性能该如何评估?目前业界内有两种: 一是峰值算力,它反映AI芯片理论上的最大算力,但却不能反映其在实际场景中的处理能力: 二是目前行 ...

最新文章

  1. Oracle中的 IN, NOT IN和 EXISTS, NOT EXISTS的區別
  2. python +java 用socket在局域网进行图片上传给springboot后端并进行前端访问
  3. Java并发编程实战 第4章 对象的组合
  4. matlab7.0停止工作,matlab7.0闪退是怎么回事_matlab7.0闪退怎么办
  5. jquery jeditable 多选插件 (checkbox or select)
  6. 如何在JavaScript中使用when()有条件地更改值
  7. PRML-系类二之2.1
  8. argmax函数_Python科学计算库numpy——统计函数
  9. CSDN开设博客专栏的方法
  10. 实现ip数据包抓取并分析_一些网站https证书出现问题的情况分析
  11. Spring Boot细节挖掘(Docker部署项目)
  12. php设计模式 -- 迭代器模式
  13. 【POJ】【2125】Destroying the Graph
  14. 2019,我们被“黑”科技薅过的羊毛?
  15. 【Python】与或非的符号表示
  16. cms php 免费,十大免费PHP内容管理系统(CMS)
  17. dau计算-预测日活
  18. 如何构建自己的知识体系
  19. 机器学习第一章 发展历史与背景
  20. (转载)机器学习方法的PPT .

热门文章

  1. oracle如何检索文件,从Oracle数据库检索文件的示例
  2. python中的zip是什么意思_python中zip是什么函数
  3. python replace替换多个字符_关于python:使用string.replace(x,y)替换所有
  4. 河北省国家电网计算机专业,河北省国家电网计算机类题目库.doc
  5. linux下qt对csv文件读取,qt 写入csv文件
  6. 转--ASP.NET页面之间传值方式
  7. 迁移桌面程序到MS Store(8)——通过APPX下载Win32Component
  8. mini-css-extract-plugin简介
  9. 161227、js显示对象所有属性和方法的函数
  10. String转换成int型