DensePose开源了,2D变3D人体姿势实时识别 | Facebook@CVPR 2018
圆栗子 编译整理
量子位 出品 | 公众号 QbitAI
大家可能还记得,今年2月Facebook发布的,人体姿势实时识别系统DensePose。
现在,代码开源了。撒花。
100人也很轻松
DensePose,这项技术可以把2D图像,转换成3D人体模型,并已成功跻身今年CVPR的Oral环节。
Facebook和来自法国的INRIA研究所共同开发的AI,和传统姿态估计系统很不一样。
前人的姿势识别,大多是着眼一组关节,比如手腕,比如肘部。
不过,Facebook团队觉得,这样的观察方式,是没有办法深刻理解图像的。
他们需要的是,人体表面的全方位观察,把每个人变成UV贴图,一片一片一片,一片。
系统可以覆盖浑身上下超过5000个节点,比十几个关节要细致得多。
另外,DensePose每秒处理多帧画面,而且,就算视频里同时出现100个人,也没问题。
每一个被人体占据的像素,尽收眼底。
这样的任务,一个GPU可以完全搞定。2D转3D的速度和准确度,有希望为AR/VR这样的应用提供加持。
数据集叫COCO
这样的成就,DensePose-COCO功勋卓著。
这是一个大规模的参考标准 (Ground Truth) 数据集。里面包含了5万人图像 - 表面UV图的一一对应。
随机采样的人类,千姿百态,还有各个身体部位分割开来的样子。
万事俱备,只是数据集还没开源。
模型结构怎样
DensePose-RCNN,深度神经网络的结构,是团队新建的。
他们是在Facebook自家的物体检测平台Detectron上面,搭起了这样一个模型。
在全卷积处理之后,用了兴趣区域池化层 (ROI Pooling) 。研究人员用三个输出通道,扩增了这个网络。
训练好之后,AI可以把每一个像素,分配到不同的身体部位,给出U坐标和V坐标。
看着自家神经网络茁壮成长,Facebook团队还在博客里致谢了被并到PyTorch里的Caffe 2。
学习时间
现在,既然还不知道数据集里面,有多少羞羞的姿势,大家就先瞻仰一下代码吧。
GitHub传送门:
https://github.com/facebookresearch/DensePose
顺便,CVPR正在盐湖城开心地进行。6月22日,就要轮到DensePose团队开讲,当地时间早8点之前,沉迷学习的各位可以趁机复习一下论文。
论文传送门:
https://arxiv.org/pdf/1802.00434.pdf
— 完 —
诚挚招聘
量子位正在招募市场运营实习生,参与线上/线下活动整体流程,帮助制作相关物料,运营社群等。工作地点在北京中关村。
期待有热情的同学加入!简历欢迎投递到quxin@qbitai.com
具体细节,请在量子位公众号(QbitAI)对话界面,回复“实习生”三个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
DensePose开源了,2D变3D人体姿势实时识别 | Facebook@CVPR 2018相关推荐
- 2D与3D人体姿态估计数据集(统计)
2D与3D人体姿态估计数据集(统计) 图像级2D单人数据集 Leeds Sports Pose (LSP) Dataset Frames Labeled in Cinema (FLIC) Datase ...
- 2D变3D,视角随意换,神还原高清立体感,还是不用3D建模的那种 | 代码数据开源...
十三 鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 看到这张恐龙化石的动态图片,你肯定会认为是用视频截出来的吧? 然而真相却是--完全由静态图片生成! 没错,而且还是不用3D建模的那种. ...
- 只需 2 张照片就能 2D 变 3D,这个 AI 能自己脑补蜡烛吹灭过程
2张废片啪地一合! 错过的精彩瞬间立刻重现,还能从2D升到3D效果. 看,小男孩可爱的笑容马上跃然浮现: 吹灭生日蛋糕蜡烛的瞬间也被还原了出来: 咧嘴笑起来的过程看着也太治愈了吧~ 咱就是说,这回相机 ...
- CVPR 2022 | 只需2张照片就能2D变3D,这个AI脑补蜡烛吹灭过程
来源:量子位 2张废片啪地一合! 错过的精彩瞬间立刻重现,还能从2D升到3D效果. 看,小男孩可爱的笑容马上跃然浮现: 吹灭生日蛋糕蜡烛的瞬间也被还原了出来: 咧嘴笑起来的过程看着也太治愈了吧~ 咱就 ...
- 2D和3D人体姿态数据集
转自链接:https://www.jianshu.com/p/c046db584a21 2D数据集 LSP 地址:http://sam.johnson.io/research/lsp.html 样本数 ...
- 微软开源3D人体姿态估计的交叉视图融合算法,提高SOTA精度
今天分享一下微软亚洲研究院新的开源3D姿态估计的一篇论文:用于3D人体姿势估计的Cross View Fusion,它大大减少了3D姿态估计的误差. 在H36M数据集上,MPJPE(关节点误差平均值) ...
- 无需3D运动数据训练,最新人体姿势估计方法达到SOTA | CVPR 2020
作者 | Muhammed Kocabas 译者 | 刘畅 出品 | AI科技大本营(ID:rgznai100) 人体的运动对于理解人的行为是非常重要的.尽管目前已经在单图像3D姿势和动作估计方面取得 ...
- CVPR2020|无需3D运动数据训练,最新SOTA人体姿势估计方法
点击我爱计算机视觉标星,更快获取CVML新技术 作者 | Muhammed Kocabas 译者 | 刘畅 出品 | AI科技大本营(ID:rgznai100) 人体的运动对于理解人的行为是非常重要的 ...
- 【人体姿态估计综述(2D、3D)】
人体姿态估计综述(2D.3D) 一.任务描述 二.2D人体姿态估计 2.1 2D单人姿态估计 2.1.1 回归方法 2.1.2 heatmap方法 2.2 2D多人姿态估计 2.2.1 自顶向下 2. ...
最新文章
- 网络工程师,不需要学Linux?
- 梯度消失问题学习资料整理
- ubuntu下解决oracle sqlplus不能查看历史命令问题
- 为什么说要重视神经网络加速器
- 每天一道LeetCode-----最长回文子串/序列,从头开始的最长回文子串长度
- html之file标签 --- 图片上传前预览 -- FileReader
- shell脚本自动备份MySQL数据库
- 链表操作时头结点的好处
- Java通过FFMPEG获取视频时长
- Delphi常用字符串函数
- 如何使用QXDM 的1477项 转化utc时间
- Android实现选择题答题(包括单选、多选和答题卡)
- 密码编码学与网络安全(学习)
- linux软硬链接 计数,深入理解Linux的软链接和硬链接
- Audio Hijack for Mac(音频录制工具)
- 国际上哪个学校计算机专业好,美国计算机专业大学排名前十有哪些?
- 简单算法 - 链表逆序思路详解
- php表格怎么自动排序,Excel表格怎么自动排名
- 11gRAC权限问题导致的集群及数据库无法启动
- 【蓝桥杯】 C++ 纸张尺寸
热门文章
- python 消息框架_消息框架message
- 广义典型相关分析_一文教你掌握广义估计方程
- 计算机安全防范系统维护,安防系统维护与设备维修(全彩)
- Web前端精髓年终总结
- java线程计数器_CountDownLatch----线程计数器
- java swing 按键_Java Swing 快捷键
- h5居中loading_实现整个html居中最简单方法
- java以下属于合法标识符的是_2012年计算机二级Java合法标识符章节练习题及答案...
- 汉字笔顺口诀_一帮40后理工男编出新型字典,《笔顺码字典》在汉首发
- java long 内存溢出_JAVA内存区域与内存溢出异常