arXiv-2020


文章目录

  • 1 Background and Motivation
  • 2 Advantages / Contributions
  • 3 Method
  • 4 Experiments
  • 5 Conclusion(own)

1 Background and Motivation

人体关键点存在的难点:a wide variety of poses, numerous degrees of freedom, and occlusions.

本位没有聚焦解决上述难点,而是从快的方面入手,提速

2 Advantages / Contributions

  • a novel body pose tracking solution
  • a lightweight body pose estimation neural network

3 Method

整体预测流程如下,涉及到了跟踪和关键点检测

The tracker predicts

  • key-point coordinates
  • the presence of the person on the current frame
  • the refined region of interest for the current frame

When the tracker indicates that there is no human present, we re-run the detector network on the next frame.

注意,没有用人体检测器去检测人,而是采用了 face detector,先找 RoI,人脸,臀部中点,肩膀中点,臀部中点与肩膀中点的夹角,然后可以使其平行于竖直方向,来对齐


图片来源 简单几行代码玩转实时人体姿态追踪算法BlazePose

像达芬奇的《维特鲁威人》这样,这样对齐后也会有利于跟踪

会预测出 33 个关键点

每个关键点对应的类别如下

  1. Nose

  2. Left eye inner(眼睛内侧)

  3. Left eye

  4. Left eye outer(眼睛外侧)

  5. Right eye inner

  6. Right eye

  7. Right eye outer

  8. Left ear

  9. Right ear

  10. Mouth left

  11. Mouth right

  12. Left shoulder

  13. Right shoulder

  14. Left elbow

  15. Right elbow

  16. Left wrist

  17. Right wrist

  18. Left pinky #1 knuckle(小拇指)

  19. Right pinky #1 knuckle

  20. Left index #1 knuckle(食指)

  21. Right index #1 knuckle

  22. Left thumb #2 knuckle(拇指)

  23. Right thumb #2 knuckle

  24. Left hip

  25. Right hip

  26. Left knee

  27. Right knee

  28. Left ankle

  29. Right ankle

  30. Left heel(脚跟)

  31. Right heel

  32. Left foot index

  33. Right foot index

关键点预测模型结构如下


既有热力图预测关键点(准),又有回归预测关键点(快)

训练时两者都采用,共享了部分特征图,梯度没有共享(the gradients from the regression encoder are not propagated back to the heatmaptrained features),梯度不共享的好处:not only improve the heatmap predictions, but also substantially increase the coordinate regression accuracy

推理时,仅保留回归分支

4 Experiments

数据集

  • AR Dataset
  • Yoga Dataset

训练时

10% scale and shift augmentations,有利于跟踪

simulate occlusions (random rectangles filled with various colors),每个关键点都有是否可见或者准确的概率

测试,在 COCO 17 个关键点上进行,结果如下


评价指标 the Percent of Correct Points with 20% tolerance (PCK@0.2) (where we assume the point to be detected correctly if the 2D Euclidean error is smaller than 20% of the corresponding person’s torso size

效果展示

5 Conclusion(own)

https://github.com/google/mediapipe

Pose 是 3D 的

【BlazePose】《BlazePose: On-device Real-time Body Pose tracking》相关推荐

  1. 【HRNet】《Deep High-Resolution Representation Learning for Human Pose Estimation》

    CVPR-2019 代码:https://github.com/leoxiaobin/deep-high-resolution-net.pytorch 文章目录 1 Background and Mo ...

  2. 【FAS-FRN】《Recognizing Multi-modal Face Spoofing with Face Recognition Networks》

    CVPR-2019 workshop code:https://github.com/AlexanderParkin/ChaLearn_liveness_challenge 文章目录 1 Backgr ...

  3. 【R-FCN】《R-FCN: Object Detection via Region-based Fully Convolutional Networks》

    NIPS-2016 文章目录 1 Motivation 2 Innovation 3 Advantages 4 Methods 4.1 Structures 4.2 train 4.3 inferen ...

  4. 【原创】《麦肯锡入职培训第一课》读书感悟

    自己作为新人刚入职,除了在编程技巧方面又需要学习提高的地方意外,自己在和领导沟通.和业务沟通上面遇见了许多问题,自己做的事情往往得不到领导的肯定,自己总结了一下原因,自己从学生到公司职员在做事的思维上 ...

  5. 【推荐】《Android应用安全设计及安全编码指导手册》更新到2016年9月1日版本

    更新:<Android应用安全设计及安全编码指导手册>[2017年2月1日英文版] 0. 下载地址 该手册有日文版和英文版,英文版下载地址在:https://www.jssec.org/d ...

  6. 【控制】《多智能体系统的协同群集运动控制》陈杰老师-目录

    无 回到目录 第1章 跳转链接 章节 跳转链接 第1章 绪论 第2章 连通性保持条件下多智能体系统群集运动控制 第3章 基于代数连通度估计的多智能体系统群集运动控制 第4章 连通性保持下多移动机器人群 ...

  7. 【机器翻译】《Nearest Neighbor Knowledge Distillation for Neural Machine Translation》论文总结

    <Nearest Neighbor Knowledge Distillation for Neural Machine Translation>https://arxiv.org/pdf/ ...

  8. 【CTR】《Towards Universal Sequence Representation Learning for Recommender Systems》 (KDD‘22)

    <Towards Universal Sequence Representation Learning for Recommender Systems> (KDD'22) 序列推荐是根据用 ...

  9. 【控制】《多智能体机器人系统信息融合与协调》范波老师-第7章-基于 Markov 对策的多 Agent 协调

    第6章 回到目录 第8章 第7章-基于 Markov 对策的多 Agent 协调 7.1 引言 7.2 多 Agent 交互的协调与博弈分析 7.2.1 多 Agent 协调与博弈的性质 7.2.2 ...

最新文章

  1. 网站开发技巧参考大全
  2. Eclipse假死,一直LoadingDescriptFor,找到原因了
  3. 【MySQL】MHA部署与MasterFailover代码分析
  4. java二级考点速记_同学,你要的考点速记口诀汇总篇来啦,速记!
  5. Python打包EXE神器 pyinstaller
  6. 反射学习系列3-反射实例应用
  7. Spring 自定义注解,配置简单日志注解
  8. 当电压放大电路的开路增益和输出电阻固定后_晶体管放大电路的性能分析与应用...
  9. linux性能监控命令
  10. delphi解析json(解决乱码问题)
  11. iOS【面试】2018年面试题集锦
  12. 1.UML2 软件建模入门与提高 --- 面向对象和软件建模
  13. 关闭蜂鸣最简单的方法
  14. Android Contentprovider的学习实例总结
  15. 敏感词过滤/字符编码
  16. 蓝牙方案,蓝牙国密读卡器,TypeA/TypeB/Felca卡读写,分享蓝牙NFC读写器带USB接口,银行卡/CPU卡/NTAG213/Mifare卡蓝牙读写器,usb多通道通讯
  17. npm 安装axios报错
  18. 两总体均值之差的推断:匹配样本
  19. 异常事件检测论文汇总(Abnormal Event Detection)
  20. 技术美术知识学习_04:PBR的个人理解

热门文章

  1. Delphi DBGridEh按标题进行排序
  2. python实现爬虫收集图片 花瓣网_【动态网页】python3爬取花瓣网图片
  3. java 上转型对象_Java上转型和下转型对象
  4. 第四章 实验一 用类描述坦克
  5. 可以去看阿哲演唱会咯~
  6. Oracle APEX:APEX 流程的工作流管理器
  7. 十年磨一剑之我眼中的京东
  8. linux的桌面卸载了怎么恢复,桌面应用|如何通过简单的3步恢复Windows 7同时删除Ubuntu...
  9. 印度进口战斗机想退货,因系统无法识别自家口音
  10. jiaozivideoplayer全屏填充模式字幕被裁切掉了的问题解决