题目:Stacked Hourglass Networks forHuman Pose Estimation

作者背景:

ECCV 2016录用

作者来自密歇根大学

一、中心思想

- 提出一种新的卷积网络结构,称为堆叠式沙漏网络,用于人体姿态估计

- 融合各个尺度提取特征,重复自顶向下、自底向上的架构

- 几个关键技术:残差模块、Hourglass Module、中间监督

二、模型结构

对于模型的架构,我们逐级拆解来理解:

- 从最小的单元残差模块开始理解

- 残差模块组合成为Hourglass Module

- Hourglass Module堆叠起来,前后增加一些简单的层,即构成了网络整体架构

接下来进行详细解释

2.1 残差模块

残差块结构如图所示,详细的数据过程是下面的图片:

- 主体路径是是3个卷积层,卷积核分别为:1*1、3*3和1*1;

- skip路径是一个卷积核为1*1的卷积层

2.2 Hourglass Module

Hourglass Module由上面的Residual Module组成,由于它是一个递归的结构,所以可以定义一个阶数来表示递归的层数,首先来看一下一阶的Hourglass Module

上图中的Max pool代表下采样,Res代表上面介绍的Residual Module,Up Sample代表上采样,这里使用的上采样方法是最近邻差值

多阶的Hourglass Module就是将上图虚线框中的块递归地替换为一阶Hourglass Module,由于作者在实验中使用的是4阶的Hourglass Moudle,所以我们画出了4阶的Hourglass Module的示意图:


对应的原文中的一个HourglassMoudle的架构如Fig3所示,其中每个box都代表一个残差模块

2.4 整体架构

先看一下整体架构的概况,如下图所示

- 网络输入的图片分辨率为256×256,然后经过一个7*7,步长为2的卷积层,之后再经过一个残差块和Maxpooling层使得分辨率降低到64,这一步骤的目的主要是降低显存

- 然后将尺寸为64*64的特征图输入到8个堆叠起来的(4阶Hourglass Module+Res+conv+relu+conv)中,特征输出尺寸保持不变

- 最后一个Hourglass Module的输出不再进行合并,直接输出heatmap

数据流图如下所示

上面的整体网络架构图中,红色的模块为中间监督的过程,输出为16通道,针对MPII数据集,因为该数据集有16个关节点,因此输出为16通道

下面,具体介绍一下网络的中间监督过程

2.5 中间监督

- 作者在整个架构中堆叠了8个hourglass模块,提到其关键是要使用中间监督来对每一个hourglass模块进行预测,即计算每个hourglass模块输出的heatmap的损失

- 中间监督的位置图下图中蓝色部分所示,选取该位置的原因是:监督的特征,需要同时包含高级别和低级别、全局和局部特征,因此选在每个hourglass模块的输出位置

作者对每个hourglass的输出的heatmap计算loss,每个loss给予不同的权重,并加和成为模型学习的总loss,进行反向传播学

三、其他

3.1 损失函数

损失函数采用Mean Squared Error(MSE)来比较预测的heatmap与ground-truth的heatmap(在关键点中心周围使用标准差为1的2D高斯分布)

参考文献:

【1】Newell A , Yang K , Deng J . Stacked Hourglass Networks for Human Pose Estimation[J]. arXiv e-prints, 2016.

【2】https://cloud.videojj.com/bbs/topic/40/%E8%AE%BA%E6%96%87%E7%AC%94%E8%AE%B0-%E4%BA%BA%E4%BD%93%E5%A7%BF%E6%80%81%E4%BC%B0%E8%AE%A1-eccv-2016-stacked-hourglass-networks-for-human-pose-estimation

【3】https://zhuanlan.zhihu.com/p/45002720

【论文解读】Stacked Hourglass Networks相关推荐

  1. 论文分享 Stacked Hourglass Networks for Human Pose Estimation

    Alejandro Newell, Kaiyu Yang, and Jia Deng University of Michigan, Ann Arbor 2016.7 https://github.c ...

  2. Stacked Hourglass Networks 人体姿态检测

    本文是人体关键点中非常经典的一篇文章:Stacked Hourglass Networks for Human Pose Estimation 论文地址: https://arxiv.org/abs/ ...

  3. Paperreading之五  Stacked Hourglass Networks(SHN)和源码阅读(PyTorch版本)

    1.前言 这篇文章是ECCV2016的论文,Jia Deng组的工作,是top-down算法,非常经典,当时也是在各种公开数据集上霸榜.在FLIC和MPII上都是第一名(在当时),是sota算法.现在 ...

  4. Paperreading之五 Stacked Hourglass Networks(SHN)和源码阅读(PyTorch版本)

    版权声明:遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/baolinq/article/details/845753 ...

  5. (Stacked Hourglass Networks for Human Pose Estimation)用于人体姿势估计的堆叠沙漏网络

    摘要 This work introduces( 提出) a novel(新奇的) convolutional network architecture for the task of human p ...

  6. 论文阅读 Hourglass:Stacked Hourglass Networks for Human Pose Estimation

    摘要   本文介绍了一种新的卷积网络结构.为了最好的捕捉与身体相关的各种空间关系,所有尺度的特征都被处理和整合.我们展示了重复的自底向上.自顶向下的处理过程与中间监督结构一起使用是如何有效改善网络性能 ...

  7. Stacked Hourglass Networks for Human Pose Estimation

    介绍 这是一篇2016年做单人姿态估计的文章 实验用的是MPII sigle 和 FLIC ,指标PCKh 通过堆叠沙漏结构的网络进行人体姿态估计 沙漏结构指通过pooling得到低分辨率的特征,然后 ...

  8. 【人体姿态】Stacked Hourglass算法详解

    Newell, Alejandro, Kaiyu Yang, and Jia Deng. "Stacked hourglass networks for human pose estimat ...

  9. 【转】《Cascaded Pyramid Network for Multi-Person Pose Estimation》--旷世2017COCO keypoints冠军论文解读

    转自:https://blog.csdn.net/zhangboshen/article/details/78836704 简介 <Cascaded Pyramid Network for Mu ...

  10. 论文翻译——Feature Pyramid Networks for Object Detection

    摘要: 特征金字塔是识别系统中检测不同尺度目标的基本组成部分.但最近的深度学习对象检测器已经避免了金字塔表示,部分原因是它们需要大量的计算和内存.本文利用深度卷积网络固有的多尺度金字塔层次结构,以额外 ...

最新文章

  1. C利用time函数实现简单的定时器
  2. win10共享打印机怎么设置_小编为你叙述 win10系统网络共享理光打印机的设置方法的技巧介绍 -win10使用教程...
  3. 为什么csdn搜索自己文章时,加了英文分号的搜索不了?“ ' ”
  4. mysql报错:Deadlock found when trying to get lock;
  5. 致NLP学习者,该跟大佬学习做项目了,附资料
  6. 讲讲Linq to SQL映射(基础篇)
  7. 利用CountDownLatch实现的一个简单的线程同步场景
  8. android https bks,如何将.cer转换为BKS
  9. 每个人都有自己的秘密
  10. hadoop fs -ls / 出现WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform
  11. 真正厉害的人,早就戒掉了“贫穷思维”
  12. Android Studio 技巧
  13. java文字垂直居中_记录水平居中垂直居中
  14. 592. Fraction Addition and Subtraction
  15. 个推mastersecret_个推 服务端 SDK
  16. Android Studio代码统计插件Statistic
  17. R语言ggridges包绘制漂亮的峰峦图(山脊图)-下篇
  18. html5的基本工作原理,HTML5基础开发教程
  19. go-zero创建报required as: github.com/tal-tech/go-zero
  20. c语言生成随机数再升序

热门文章

  1. 手把手教你玩转KVM虚拟机--KVM管理虚拟机
  2. gzip already installed and latest version解决方法
  3. OS---Windows 7 旗舰版OEM密钥
  4. 百度低代码框架amis介绍及实例讲解
  5. usb右下角有显示,计算机没显示,U盘显示在计算机的右下角,但无法打开
  6. 怎样用计算机画图合成图片,如何用电脑自带画图软件将多张截图拼成一张图,自动生成的那种...
  7. zencart 模板文件说明
  8. Transforms的使用
  9. 黑客攻击_我如何开始黑客攻击
  10. [李景山php] web 安全资料篇