丰色 发自 凹非寺
来源:量子位(QbitAI)

不靠昂贵的动捕,直接通过视频也能提取3D人体模型然后进行生成训练:

英伟达这项最新研究不仅省钱,效果也不错——

其合成的样本完全可以用在以往只在动捕数据集上训练的运动合成模型,且在合成动作的多样性上还能更胜一筹。

成果已被ICCV 2021接收。

四个步骤从视频获得人体模型

下图概述了英伟达提出的这个从视频中获得动作样本的框架。

包含4步:

1、首先输入一个视频,使用单目姿势预估模型(pose estimator)生成由每帧图像组成的视频序列。

2、然后利用反向动力学,用每帧的3D关键点形成SMPL模型动作。

SMPL是一种参数化人体模型,也就是一种3D人体建模方法。

3、再使用他们提出的基于物理合理性的修正方法来优化上述动作;

4、 使用上述步骤处理所有视频,就可以使用获得的动作代替动捕来训练动作生成模型了。

概括起来就是用输入视频生成动作序列,然后建模成3D人体,再进行优化,最后就可以像使用标准动作捕捉数据集一样使用它们来训练你的动作生成模型。

下面是他们用该方法生成的一个样本合集:

具体效果如何?

研究人员对比了该方法与一些动捕模型,比如最新的PhysCap等。

PhysCap,一款基于AI算法的单目3D实时动捕方案。

结果发现,他们的方法在平均关节位置(MPJPE)的误差低于PhysCap。

其中的基于物理的修正方法更是将样本的脚切线速度误差降低40%以上,高度误差降低80%。

那用这些样本来训练生成模型的效果如何呢?

他们使用3个不同的训练数据集训练相同的DLow模型。

DLow(GT)是使用实际动捕数据进行训练的人体运动模型。
DLow(PE-dyn)是他们提出的方法,使用物理校正后的姿势训练。
DLow(PE-kin)也是他们的方法,没有优化过动作。

结果是DLow(PE-dyn)模型的多样性最好,超越了动捕数据集下的训练。

但在最终位移误差(FDE)和平均位移误差(ADE)上略逊一筹。

最后,作者表示,希望这个方法继续改进成熟以后,能够非常强大地利用身边的在线视频资源为大规模、逼真和多样的运动合成铺平道路。

作者信息

Xie Kevin,多伦多大学计算机专业硕士在读,也是英伟达AI Lab的实习生。

王亭午,多伦多大学机器学习小组博士生,清华本科毕业,研究兴趣为强化学习和机器人技术,重点集中在迁移学习、模仿学习。

Umar Iqbal,英伟达高级研究科学家,德国波恩大学计算机博士毕业。

后面还有其他3位来自多伦多大学和英伟达的作者,就不一一介绍了。

论文地址:
https://arxiv.org/abs/2109.09913

参考链接:

https://nv-tlabs.github.io/physics-pose-estimation-project-page/

本文仅做学术分享,如有侵权,请联系删文。

3D视觉精品课程推荐:

1.面向自动驾驶领域的多传感器数据融合技术
2.彻底搞透视觉三维重建:原理剖析、代码讲解、及优化改进
3.国内首个面向工业级实战的点云处理课程
4.激光-视觉-IMU-GPS融合SLAM算法梳理和代码讲解
5.彻底搞懂视觉-惯性SLAM:基于VINS-Fusion正式开课啦
6.彻底搞懂基于LOAM框架的3D激光SLAM: 源码剖析到算法优化
7.彻底剖析室内、室外激光SLAM关键算法原理、代码和实战(cartographer+LOAM +LIO-SAM)

干货领取:

1. 在「3D视觉工坊」公众号后台回复:3D视觉即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

2. 在「3D视觉工坊」公众号后台回复:3D视觉github资源汇总即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。

3. 在「3D视觉工坊」公众号后台回复:相机标定即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配即可下载独家立体匹配学习课件与视频网址。

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列三维点云系列结构光系列、手眼标定、相机标定、orb-slam3知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

ICCV 2021 | 英伟达新研究:直接通过视频就能捕获3D人体动作!相关推荐

  1. 英伟达新研究:“狗生猫,猫生万物”的多模态无监督图像转换

    林鳞 编译整理 量子位 出品 | 公众号 QbitAI 英伟达最近的一项研究看起来有点神奇. 一张普通的猫咪图像,可以被转换成一只老虎.一头狮子或一只美洲豹.  还是一张普通的猫咪图,还能被转换成 ...

  2. 英伟达光追支持Java吗,英伟达新显卡驱动发布 GTX 10系显卡现已支持光追

    英伟达新显卡驱动发布 GTX 10系显卡现已支持光追 2019-04-12 08:06:54来源:快科技编辑:血河评论(0) 在上个月的GDC 2019开发者大会上,NVIDIA许下承诺将会让&quo ...

  3. 英伟达新GPU发布:快到飞起,快到老黄瞬间学会了跳舞

    栗子 假装发自 东京  量子位 报道 | 公众号 QbitAI △ 没办法,就是快 快到飞起. 昨天,东京,"教主"黄仁勋发布了一枚新GPU:Tesla T4. 按照英伟达的说法, ...

  4. 英伟达新禁令:不能随便用GeForce显卡跑深度学习(挖矿可以)

    维金 允中 发自 凹非寺 量子位 出品 | 公众号 QbitAI 终于藏不住了. 正值西方国家欢度佳节之时,一份英伟达的surprise终于被发现. 是一条关于GeForce的禁令. 这款备受AI&q ...

  5. 定义为“AI计算公司”,业绩大幅下滑的英伟达新变量在哪?

     关注ITValue,查看企业级市场最新鲜.最具价值的报道! 1999年,英伟达发明了 GPU,20年后今天,GPU让英伟达攀至行业顶峰. 然而,急速膨胀后潜藏的危机,也增加了这家明星公司的焦虑感. ...

  6. 告别视频通话“渣画质”,英伟达新算法最高压缩90%流量

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 来自 | 量子位 为了让网速慢的用户用上高清通话,英伟达可谓绞尽脑汁.他们开发的新AI ...

  7. 英伟达新核弹GPU:4nm制程800亿晶体管,20张即可承载全球互联网流量,全新Hopper架构太炸了...

    丰色 萧箫 发自 凹非寺 量子位 | 公众号 QbitAI 他来了他来了,老黄带着英伟达的最新一代GPU来了. 之前大家猜的5nm错了,一手大惊喜,老黄直接上了台积电4nm工艺. 新卡取名H100,采 ...

  8. 英伟达新卡皇3090Ti:功耗飙至450W换来性能涨11%

    行早 发自 凹非寺 量子位 报道 | 公众号 QbitAI 就在正在召开的CES 2022上,英伟达推出了比"性能猛兽"3090更强悍的新一代旗舰显卡GeForce RTX 309 ...

  9. 英伟达账号为什么登录不了_告别视频通话“渣画质”,英伟达新算法最高压缩90%流量...

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 来自 | 量子位 为了让网速慢的用户用上高清通话,英伟达可谓绞尽脑汁.他们开发的新AI ...

最新文章

  1. 018_rate评分
  2. html文本框自动赋值,js给文本框赋值 value与innerHTML
  3. freecodecamp_freeCodeCamp的服务器到底发生了什么?
  4. silence丶你的名字
  5. composer全局 linux_Linux下全局安装composer方法
  6. handler回调主线程_Handler源码和9个常见问题的解答,这些你都掌握了吗?
  7. TypeScript入门学习笔记
  8. html复制粘贴后乱码,从Word复制的内容粘贴出来都是两个乱码
  9. 全国ps计算机考试时间,全国计算机考试一级PS考试大纲
  10. 计算机黑屏风扇异响,电脑开机黑屏主机风扇一直响
  11. web支付开发报错:无效的AppID参数
  12. python xlrd获取excel行数_Python 使用xlrd库读取excel,获取最大行和最大列等
  13. 安装create-react-app教程及简单配置
  14. 〖Python 数据库开发实战 - Python与MySQL交互篇⑩〗- 创建新闻管理系统的具体python文件
  15. CSDN程序员过中秋,那是一个热闹
  16. 初识flowable工作流-实现简单请假流程SpringBoot+VUE
  17. Excel中,把数字和汉字分开的方法
  18. 台湾内存厂商进军NAND市场未果,时机已过仅当利基玩家?
  19. 7-3 两个数的简单计算器 (20分)
  20. 期货负价格与巴舍利耶定价模型

热门文章

  1. centos vim配置高亮语法和格式化粘贴
  2. linux 下用户管理
  3. localhost: Error: JAVA_HOME is not set. [Hadoop] Error: JAVA_HOME is not set
  4. cocos2d-x解决中文乱码问题的几种办法
  5. jQuery-this与$(this)的区别
  6. sizeof计算类大小
  7. iptables 入门
  8. 同事说,我写Java代码像写诗
  9. 开发必备快速定位排查日志 9 大类命令详解
  10. 把Redis当作队列来用,真的合适吗?