出处“来自微信公众号:我爱计算机视觉”

MultiPoseNet:人体检测、姿态估计、语义分割一“网”打尽

原文:https://mp.weixin.qq.com/s?__biz=MzIwMTE1NjQxMQ==&mid=2247483982&idx=2&sn=3f4fb8ed9daf9b1f56cac2692d32e5f2&chksm=96f3701aa184f90c6184dbaef32dcfcdfbeff94bcd68e826947ded915387db6cc569f55155f0&mpshare=1&scene=23&srcid=08155JOr0kdngr782BEmYrID#rd

又准又快还开源,恐怕没有比这个更好的事情了。

来自中东科技大学在ECCV2018会议上已录用的文章“MultiPoseNet: Fast Multi-Person Pose Estimation using Pose Residual Network”,使用姿态残差网络Pose Residual Network (PRN)进行快速多人姿态估计。

文中提出了一种新的自底向上(Bottom-Up)模式的多人姿势估计架构,它将多任务模型(multi-task model)与新颖的分配算法(assignment method)相结合。MultiPoseNet可以联合处理人体检测,关键点检测,人体分割和姿态估计问题。新颖的分配算法由姿态残差网络(PRN)实现,该网络接收关键点和人体检测的结果,通过将关键点分配给人体实例来产生准确的姿态。在COCO关键点数据集上,该姿态估计方法在准确性(比之前最好的结果要高4个点的mAP)和速度方面均优于所有之前的自下而上(Bottom-Up)方法; 它在准确性上也可以与最好的自顶向下(Top-Down)方法相媲美,但速度至少快4倍。MultiPoseNet方法是目前最快的实时姿态估计系统,在GTX1080TI显卡上速度是23帧/秒。

多人姿态估计分为Bottom-Up方法和top-down方法两个方向。

Bottom-Up方法 先检测图像中人体部件,然后将图像中多人人体的部件分别分配到不同的人体实例上,因此这类方法在测试推断的时候往往更快速,模型Size更小,但因为没能更细致的对人脸关键点建模,所以往往准确度稍低。

Top-Down方法 将人体检测和关键点检测分离,在图像上首先运行一个人体检测器,找到所有的人体实例,对每个人体子图再使用关键点检测,这类方法往往极其慢,但姿态估计准确度较高。

MultiPoseNet多任务学习架构,同时高效地实现人体关键点检测、人体检测、语义分割:

Pose Residual Network (PRN)姿态残差网络示意图,PRN网络用来分配每个关键点属于哪个人体

特征提取用的骨干网络(Backbone)使用了带有两个Feature Pyramid Networks (FPN)的ResNet,一个输出到keypoint Estimation subnet,另一个输出到Person Detection Subnet。

keypoint Estimation subnet示意图,它将层叠的CNN特征作为输入,然后输出关键点和语义分割热图(keypoint and segmentation heatmaps)

Person Detection Subnet人体检测子网络直接使用了修改的RetinaNet,即仅让网络检测人体。

Pose Residual Network (PRN)姿态残差网络是对每一个检测到的人体区域的关键点集合,学习从关键点集合到正常分布的关键点的映射。作者称这一步叫做残差校正(residual correction),文中使用残差多层感知机(residual multilayer perceptron)来实现。

在COCO验证数据集上的精度-召回率曲线:

COCO test-dev数据集上的结果,BU是Bottom-Up方法,TD是Top-Down方法

使用不同的骨干网络性能比较

不同的PRN模型(N:nodes, D: dropout and R: residual connection)在COCO validation上的实验结果,可以看到采用残差连接的模型性能大幅提高

COCO dataset上人体检测的结果,原RetinaNet模型有80类,因为处理后只有人体一类,所以性能大幅提高

人体分割只是在关键点网络的输出层再加一层网络,所以时间代价很小,但已经达到DeepLab v2的水平

COCO test-dev dataset上图片运行结果示例

运行速度分析,模型参数量与随着人数增多检测时间变化

在1080TI显卡上,Keypoint and person detections只需要35ms,因为PRN非常快,只需要2ms,所以每增加一个实例仅多增加2ms。当图片中仅有1个人运行27帧每秒,即使有20个人,也可以达到15帧每秒。

整体上感觉这篇文章是更偏工程的,对这篇文章你有什么想法也欢迎留言。

代码已经开源:

https://github.com/mkocabas/pose-residual-network/

MultiPoseNet:人体检测、姿态估计、语义分割一“网”打尽相关推荐

  1. DeepFashion2: 一个针对衣服图片的检测、姿态估计、分割和重认证多用途基准

    DeepFashion2: 一个针对衣服图片的检测.姿态估计.分割和重认证多用途基准 DeepFashion2: A Versatile Benchmark for Detection, Pose E ...

  2. 3D Human相关研究总结:人体、姿态估计、人体重建等

    ©PaperWeekly 原创 · 作者|张莹 单位|腾讯 本文简要介绍与 3D 数字人相关的研究,包括常用 3D 表示.常用 3D 人体模型.3D 人体姿态估计,带衣服 3D 人体重建,3D 衣服建 ...

  3. CV之IS:计算机视觉之图像分割(Image Segmentation)算法的挑战任务、算法演化、目标检测和图像分割(语义分割/实例分割/全景分割)的对比

    CV之IS:计算机视觉之图像分割(Image Segmentation)算法的挑战任务.算法演化.目标检测和图像分割(语义分割/实例分割/全景分割)的对比 相关文章 CV之IS:计算机视觉之图像分割( ...

  4. AAAI论文首发:几何驱动的自监督的人体3D姿态估计方法

    徐亦达团队和北理工李侃老师的共同博士生李杨在AAAI 的发表了一篇机器学习论文,本人得到徐老师授权在本站发布论文. Geometry-driven Self-supervised Method for ...

  5. 空间中的语义直线检测_基于语义分割的车道线检测算法研究

    龙源期刊网 http://www.qikan.com.cn 基于语义分割的车道线检测算法研究 作者:张道芳 张儒良 来源:<科技创新与应用> 2019 年第 06 期 摘 ; 要:随着半自 ...

  6. 人体骨骼关键点检测(姿态估计)综述2019

    目录: 1.前言 2.相关数据集 3.研究方向分类 4.单人关键点检测的发展(2016-2019) 5.Ground Truth的构建 6.自上而下的人体关键点检测算法 一.前言 人体骨骼关键点检测是 ...

  7. android 人脸检测 姿态估计

    自带级联,有误检,能调用摄像头,返回opencv,很多函数没有 https://github.com/WangRain1/OpencvDemo 新的: https://github.com/mateu ...

  8. 计算机视觉:图像分类、物体检测、图像语义分割、实例分割和全景分割

    计算机视觉 图像分类 Image Classification 物体检测 Object Detection/ Object Localization 语义分割 Semantic Segmentatio ...

  9. 3D Human相关研究:人体、姿态估计、人体重建等

    最近刚开始看三维仿真方面的文章,小白有很多知识都不懂,只能一点一点的在网上查,借这个平台做做笔记. 常用3D表示 目前 3D 学习中,物体或场景的表示包括显式表示与隐式表示两种,主流的显式表示包括基于 ...

最新文章

  1. 找出如下数组中最大的元素和最小的元素, a[][]={{3,2,6},{6,8,2,10},{5},{12,3,23}}
  2. DNNBrain:北师大团队出品,国内首款用于映射深层神经网络到大脑的统一工具箱...
  3. fieldset在ie8下的margin\padding bug规避
  4. 光流 | OpenCV中的光流有关函数
  5. Win10卸载python总是提示error2503失败各种解决办法
  6. 分享10个值得关注的C语言开源项目
  7. Breadth-first Search(广度优先搜索)专题1
  8. SpringBoot+Redis缓存概念介绍
  9. typec扩展坞hdmi没反应_京造十合一便携扩展坞:桌面好物解决接口匮乏的大问题...
  10. 【2013高考作文】重庆作文
  11. 数据降维——因子分析
  12. 做了个小工具,可以一键导出所有微信表情包,有趣的表情包,不再只限一个APP使用,【微信表情包吸血鬼】
  13. 92_目标:2019年底博客访问量达到10W+
  14. 降噪蓝牙耳机哪个品牌好?降噪蓝牙耳机排行推荐
  15. 解决微信登录Emoji表情昵称乱码问题
  16. 基于单片机的温度计设计
  17. h5 每页打印固定表头以及表尾 解决表头过长打印分页表头不固定问题
  18. 快乐的背后 ——纪5日4夜的游行
  19. 东方通应用服务器TongWeb的安装,使用,排错(不定时更新)
  20. java的意思 java语言的优点有什么

热门文章

  1. java 原子引用_Java 原子性引用 AtomicReference
  2. java配置解决方法_如何配置Java环境变量及可能出现问题的解决方法
  3. java 和equals_java中的==和equals()
  4. 与c交互_SV DPI-C接口学习心得
  5. spring_有关Spring缓存性能的更多信息
  6. jdk安装教程_使用JDK 8流在包装对象的集合和包装对象的集合之间转换
  7. win10系统启动服务器不可用,解决win10专业版windows installer服务不可用不能启动更不能访问...
  8. sql 按 月份 结余_积累中沉淀,反思中提升——白霓镇幼儿园九月份工作总结会...
  9. 为什么 StringBuilder 不是线程安全的?
  10. 大厂,常用,四款,大屏可视化工具