这是ECCV2016，密歇根大学的研究团队做的工作，后续的很多人体姿态估计方法都借鉴了hourglass网络结构，并进行了改进，可以说hourglass的网络结构算是受到了业界的认可。

1. 研究问题

人体姿态估计任务，需要同时利用局部信息和全局信息。

2. 研究方法

提出沙漏模块，捕获和整合多尺度信息（局部和全局上下文），并且堆叠多个沙漏，重复自下而上，自上而下的推理，结合中间监督的使用，预测人体关键点。

单一沙漏模块

整个沙漏结构是对称的，输入先经过"bottom-up"过程（池化降采样和一系列的残差块）做特征提取，后经过“top-down”过程（最近邻插值上采样和加法连接）做特征融合，最后基于融合后的特征图预测骨骼关键点。

Fig3 中的每个块都是残差块，残差块只提取特征，不做图像缩放，缩放只在池化和插值中做，从图中可见，每个残差块都输出256个特征图。

带有中间监督的堆叠沙漏网络

利用单个沙漏网络可以提取多尺度特征，文章使用8个堆叠的沙漏提取更高级的特征，并且在每个沙漏后预测热图进行中间监督，以提高网络的性能。

堆叠沙漏网络

中间监督

上图的蓝色块就是预测的热图，然后利用1*1卷积增加维度，和上一级的沙漏输出和本级的沙漏输出叠加，作为下一个沙漏的输入。

3. 实验结果

4. 结论

（1）沙漏模块可以提取多尺度信息，有利于人体姿态估计。
（2）堆叠的沙漏以及中间监督过程进一步提升网络的预测能力。

《Stacked Hourglass Networks for Human Pose Estimation》相关推荐

（Stacked Hourglass Networks for Human Pose Estimation）用于人体姿势估计的堆叠沙漏网络
摘要 This work introduces( 提出) a novel(新奇的) convolutional network architecture for the task of human p ...
论文阅读 Hourglass:Stacked Hourglass Networks for Human Pose Estimation
摘要本文介绍了一种新的卷积网络结构.为了最好的捕捉与身体相关的各种空间关系,所有尺度的特征都被处理和整合.我们展示了重复的自底向上.自顶向下的处理过程与中间监督结构一起使用是如何有效改善网络性能 ...
Stacked Hourglass Networks for Human Pose Estimation
介绍这是一篇2016年做单人姿态估计的文章实验用的是MPII sigle 和 FLIC ,指标PCKh 通过堆叠沙漏结构的网络进行人体姿态估计沙漏结构指通过pooling得到低分辨率的特征,然后 ...
论文分享 Stacked Hourglass Networks for Human Pose Estimation
Alejandro Newell, Kaiyu Yang, and Jia Deng University of Michigan, Ann Arbor 2016.7 https://github.c ...
《Towards Viewpoint Invariant 3D Human Pose Estimation》--深度图领域人体姿态估计的CNN算法
<Towards Viewpoint Invariant 3D Human Pose Estimation>–深度图领域人体姿态估计的CNN算法这篇文章是ECCV 2016的一篇3D人体 ...
【HRNet】《Deep High-Resolution Representation Learning for Human Pose Estimation》
CVPR-2019 代码:https://github.com/leoxiaobin/deep-high-resolution-net.pytorch 文章目录 1 Background and Mo ...
【转】《Cascaded Pyramid Network for Multi-Person Pose Estimation》--旷世2017COCO keypoints冠军论文解读
转自:https://blog.csdn.net/zhangboshen/article/details/78836704 简介 <Cascaded Pyramid Network for Mu ...
《Stacked Attention Networks for Image Question Answering》论文解读与实验
这是去年10月份,自己看的第一篇关于VQA的论文,由于课程内容需要,对论文内容理解得还算深入,并在github上找了一些代码来实验.下面直接开始~ 1. 实验目的完成一项视觉问答(VQA)的任务,即 ...
[Rethinking on Multi-Stage Networks for Human Pose Estimation] 论文解读
1,摘要: 单阶段网络多阶段网络(尽管多阶段网络更适合当前的工作,但是目前多阶段表现还是没有单阶段好) 2,介绍: 近年来,使用深卷积神经网络的人体姿态估计问题得到了快速发展.目前,表现最佳的方法非 ...
【Simple Baselines】《Simple Baselines for Human Pose Estimation and Tracking》
ECCV-2018 文章目录 1 Background and Motivation 2 Advantages / Contributions 3 Method 3.1 Pose Estimation ...

《Stacked Hourglass Networks for Human Pose Estimation》