《Stacked Hourglass Networks for Human Pose Estimation》
这是ECCV2016,密歇根大学的研究团队做的工作,后续的很多人体姿态估计方法都借鉴了hourglass网络结构,并进行了改进,可以说hourglass的网络结构算是受到了业界的认可。
1. 研究问题
人体姿态估计任务,需要同时利用局部信息和全局信息。
2. 研究方法
提出沙漏模块,捕获和整合多尺度信息(局部和全局上下文),并且堆叠多个沙漏,重复自下而上,自上而下的推理,结合中间监督的使用,预测人体关键点。
单一沙漏模块
整个沙漏结构是对称的,输入先经过"bottom-up"过程(池化降采样和一系列的残差块)做特征提取,后经过“top-down”过程(最近邻插值上采样和加法连接)做特征融合,最后基于融合后的特征图预测骨骼关键点。
Fig3 中的每个块都是残差块,残差块只提取特征,不做图像缩放,缩放只在池化和插值中做,从图中可见,每个残差块都输出256个特征图。
带有中间监督的堆叠沙漏网络
利用单个沙漏网络可以提取多尺度特征,文章使用8个堆叠的沙漏提取更高级的特征,并且在每个沙漏后预测热图进行中间监督,以提高网络的性能。
堆叠沙漏网络
中间监督
上图的蓝色块就是预测的热图,然后利用1*1卷积增加维度,和上一级的沙漏输出和本级的沙漏输出叠加,作为下一个沙漏的输入。
3. 实验结果
4. 结论
(1)沙漏模块可以提取多尺度信息,有利于人体姿态估计。
(2)堆叠的沙漏以及中间监督过程进一步提升网络的预测能力。
《Stacked Hourglass Networks for Human Pose Estimation》相关推荐
- (Stacked Hourglass Networks for Human Pose Estimation)用于人体姿势估计的堆叠沙漏网络
摘要 This work introduces( 提出) a novel(新奇的) convolutional network architecture for the task of human p ...
- 论文阅读 Hourglass:Stacked Hourglass Networks for Human Pose Estimation
摘要 本文介绍了一种新的卷积网络结构.为了最好的捕捉与身体相关的各种空间关系,所有尺度的特征都被处理和整合.我们展示了重复的自底向上.自顶向下的处理过程与中间监督结构一起使用是如何有效改善网络性能 ...
- Stacked Hourglass Networks for Human Pose Estimation
介绍 这是一篇2016年做单人姿态估计的文章 实验用的是MPII sigle 和 FLIC ,指标PCKh 通过堆叠沙漏结构的网络进行人体姿态估计 沙漏结构指通过pooling得到低分辨率的特征,然后 ...
- 论文分享 Stacked Hourglass Networks for Human Pose Estimation
Alejandro Newell, Kaiyu Yang, and Jia Deng University of Michigan, Ann Arbor 2016.7 https://github.c ...
- 《Towards Viewpoint Invariant 3D Human Pose Estimation》--深度图领域人体姿态估计的CNN算法
<Towards Viewpoint Invariant 3D Human Pose Estimation>–深度图领域人体姿态估计的CNN算法 这篇文章是ECCV 2016的一篇3D人体 ...
- 【HRNet】《Deep High-Resolution Representation Learning for Human Pose Estimation》
CVPR-2019 代码:https://github.com/leoxiaobin/deep-high-resolution-net.pytorch 文章目录 1 Background and Mo ...
- 【转】《Cascaded Pyramid Network for Multi-Person Pose Estimation》--旷世2017COCO keypoints冠军论文解读
转自:https://blog.csdn.net/zhangboshen/article/details/78836704 简介 <Cascaded Pyramid Network for Mu ...
- 《Stacked Attention Networks for Image Question Answering》论文解读与实验
这是去年10月份,自己看的第一篇关于VQA的论文,由于课程内容需要,对论文内容理解得还算深入,并在github上找了一些代码来实验.下面直接开始~ 1. 实验目的 完成一项视觉问答(VQA)的任务,即 ...
- [Rethinking on Multi-Stage Networks for Human Pose Estimation] 论文解读
1,摘要: 单阶段网络 多阶段网络(尽管多阶段网络更适合当前的工作,但是目前多阶段表现还是没有单阶段好) 2,介绍: 近年来,使用深卷积神经网络的人体姿态估计问题得到了快速发展.目前,表现最佳的方法非 ...
- 【Simple Baselines】《Simple Baselines for Human Pose Estimation and Tracking》
ECCV-2018 文章目录 1 Background and Motivation 2 Advantages / Contributions 3 Method 3.1 Pose Estimation ...
最新文章
- jdk8新特性_JDK8与JDK9新特性学习
- 小程序获取form_id 与 小程序获取openid
- 抓包及分析包的常用命令
- 定义一个Employee类并排序(完整版本)
- 微软:四种方法暂时屏蔽IE最新漏洞
- 51/52单片机 TCON控制字及TMOD寄存器
- matlab读写xlsx文件
- chrome中验证码图片不显示的解决办法
- 【考研政治】1. 导论和基本哲学问题
- 团队管理之—— 定目标:让你的方向与公司的方向保持一致
- ajax 数据接收,前端数据获取之Ajax篇
- poi hssfcellstyle 文字方向_揭秘!文字识别在高德地图数据生产中的演进
- 选队长游戏(Java)
- 叶公好龙——存在与逻辑
- 2022年牛客多校第三场补题记录
- 常见的 PHP IDE 开发工具汇总 (LAMP)
- 设备树学习(十八、番外篇-中断子系统之初始化一个中断控制器)
- 国际网页短信后台定制源码搭建软件平台定制-移讯云短信系统
- python 电脑状态_Python实现简单状态框架的方法 -电脑资料
- 那些英语不好的人现在在职场都混得如何?