继上次分享的中科院博士用一张“静态图”就能实现人脸3D建模新研究,又一重要力作。

手动对人体进行3D建模并非易事。

但现在,只给AI高清照片,它还真就能分分钟搞定这件事。

甚至还挺高清,衣服褶皱、面部表情,细节一点不少。

这项新研究来自南加州大学和Facebook,中选CVPR 2020。

并且已经在GitHub上开源,标星3.6k,还在一天内就涨了207颗星,登上GitHub热榜。

一起来看看,这究竟是如何实现的。

论文摘要

深度神经网络驱动基于图像的3D人体形状估计发展前沿技术。尽管当前的方法已经证明了在现实环境中的潜力,但是它们仍然无法以输入图像中经常出现的细节水平进行重建。

作者认为,这种局限性主要来自两个相互矛盾的要求。准确的预测需要大背景,但是精确的预测需要高分辨率。由于当前硬件中的内存限制,以前的方法倾向于将低分辨率的图像作为输入来覆盖较大的空间上下文,并因此产生精度较低(或低分辨率)的3D估计。

作者通过制定一种端到端可训练的多层体系结构来解决此限制。粗糙级别以较低的分辨率观察整个图像,并着重于整体推理。这提供了一个很好的环境,可以通过观察更高分辨率的图像来估计高度详细的几何形状。

通过充分利用1k分辨率的输入图像,该方法在单图像人形重建方面明显优于现有的最新技术。

多级像素对齐隐式函数

这只AI名叫PIFuHD,其基础框架是ICCV 2019上已经登场的像素对齐隐式函数PIFu。不过,PIFu以分辨率为512×512的图像作为输入,输出的3D模型分辨率不高。

为了得到高分辨率的输出,在这项研究中,研究人员在PIFu的基础之上,额外叠加了一个像素对齐的预测模块。

如图所示,顶部粗层次像素对齐预测器捕捉全局的3D结构。高分辨率的细节则由下面的Fine模块添加。

具体而言,fine模块将1024×1024的图像作为输入,并将其编码成高分辨率的图像特征(512×512)。

此后,高分辨率特征嵌入和第一个模块中得到的3D嵌入被结合起来,用以预测占位概率场。

为了进一步提高重建的质量和保真度,该方法还会在图像空间中预测正反两面的法线图,并将其作为额外的输入反馈给网络。

细节捕捉高手

所以,跟前辈们相比,PIFuHD究竟进步了多少?

研究人员在People Snapshot dataset数据集上将其与此前的SOTA方法进行了定性比较。

可以明显看出,由于PIFuHD充分利用了基础形状和精细形状,能够直接在像素级别上预测3D几何形状,它对输入图像的细节把握更加精准,重建出来的3D人体模型分辨率更高。

Oral视频

Demo可玩

论文代码已经开源,并且,研究团队还在Colab上提供了在线试玩。

输入一张你自己的照片,几分钟之内就能收获一个数字3D的你。

真·3D建模师福音。

结合可以让3D模型动起来的Mixamo食用,网友们都玩嗨了。

赶快上手玩起来吧~

相关工作

Monocular Real-Time Volumetric Performance Capture (ECCV 2020)
Ruilong Li*, Yuliang Xiu*, Shunsuke Saito, Zeng Huang, Kyle Olszewski, Hao Li

The first real-time PIFu by accelerating reconstruction and rendering!!

PIFu: Pixel-Aligned Implicit Function for High-Resolution Clothed Human Digitization (ICCV 2019)
Shunsuke Saito*, Zeng Huang*, Ryota Natsume*, Shigeo Morishima, Angjoo Kanazawa, Hao Li

The original work of Pixel-Aligned Implicit Function for geometry and texture reconstruction, unifying sigle-view and multi-view methods.

Learning to Infer Implicit Surfaces without 3d Supervision (NeurIPS 2019)
Shichen Liu, Shunsuke Saito, Weikai Chen, Hao Li

We answer to the question of "how can we learn implicit function if we don't have 3D ground truth?"

SiCloPe: Silhouette-Based Clothed People (CVPR 2019, best paper finalist)
Ryota Natsume*, Shunsuke Saito*, Zeng Huang, Weikai Chen, Chongyang Ma, Hao Li, Shigeo Morishima

作者简介

最后,附上作者简介。

论文一作斋藤俊辅(Shunsuke Saito),目前在Facebook Reality Labs担任研究科学家,致力于深度人类数字化的有效数据表征研究。

他在南加州大学工作期间,曾与计算机图形学领域知名华人教授黎颢合作。

传送门

  • 论文:https://arxiv.org/pdf/2004.00452.pdf

  • GitHub地址:https://github.com/facebookresearch/pifuhd

  • 项目地址:https://shunsukesaito.github.io/PIFuHD/

  • Demo地址:https://colab.research.google.com/drive/11z58bl3meSzo6kFqkahMa35G5jmh2Wgt?usp=sharing#scrollTo=afwL_-ROCmDf

- END -  

往期精彩回顾适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
AI基础下载机器学习的数学基础专辑
获取本站知识星球优惠券,复制链接直接打开:
https://t.zsxq.com/qFiUFMV
本站qq群704220115。加入微信群请扫码:

【CV】给AI一张高清照片,分分钟还你细节满满的3D人体模型,GitHub标星4.4k | 在线可玩...相关推荐

  1. 在线可玩 | 给AI一张高清照片,分分钟还你细节满满的3D人体模型,GitHub标星3.6k...

    本文经AI新媒体量子位(公众号 ID: QbitAI)授权转载,转载请联系出处 本文长度为800字,建议阅读5分钟 网友们都玩出花儿了. 手动对人体进行3D建模并非易事. 但现在,只给AI一张高清照片 ...

  2. 给AI一张高清照片,分分钟还你细节满满的3D人体模型,GitHub标星3.6k | 在线可玩...

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 手动对人体进行3D建模并非易事. 但现在,只给AI一张高清照片,它还真就能分分钟搞定这件事. ...

  3. GitHub标星3.6k | 给AI一张高清照片,分分钟还你3D人体模型

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:量子位 AI博士笔记系列推荐 周志华<机器学习> ...

  4. 神漏洞!一张高清照片,破解三星Galaxy S8虹膜识别

    本文讲的是 神漏洞!一张高清照片,破解三星Galaxy S8虹膜识别, 生物识别技术再次表现出不靠谱的一面. 就在昨天,三星最新旗舰设备Galaxy S8上的虹膜识别技术被混沌计算机俱乐部(CCC)破 ...

  5. GitHub 标星 2.3k+,比个手势,AI 自动识别 Emoji!

    关注 "GitHubDaily" 设为 "星标",每天带你逛 GitHub! 转自量子位,作者圆栗子 一只手势识别 AI,怎样才算得上 (优) 秀啊? 不停地变 ...

  6. AI说,它可以把你变成个游戏 | 3D人体模型 · CVPR

    三维栗子 发自 凹非寺  量子位 报道 | 公众号 QbitAI △ 死亡效应2 搭建3D人体模型,早已是AI驾(le)轻(bu)就(si)熟(shu)的一项工作,不论是在VR里,电影里,还是时尚圈. ...

  7. GitHub 标星 20000+,国产 AI 开源从算法开始突破 | 专访商汤联合创始人林达华

    作者 | 阿司匹林 责编 | 李雪敬 封图 | CSDN 下载自视觉中国 作为已经有4000多名员工的AI独角兽,商汤的一举一动备受关注. 从2018年开始,奔着"开源.统一.可复现&quo ...

  8. 火到海外破圈!这个国产AI项目GitHub标星8.6k,价值千万

    Q:最顶尖的AI技术到底离我们有多远? A:三行Python代码的距离. 导读 今天小编为大家推荐一个AI领域相当优秀的项目, 粗略估计,这个项目价值超过千万, 当前star 8.6k,大胆预判,这个 ...

  9. 试试这个文字冒险游戏,故事是AI写的:情节丰满逻辑不乱,进去就出不来了,在线可玩...

    栗子 发自 凹非寺  量子位 报道 | 公众号 QbitAI 15亿参数的终极版GPT-2,就是OpenAI那只编故事成瘾的AI,都能拿来做些什么? 有人用它做了个文字冒险游戏,并赐以优美的名字,叫& ...

最新文章

  1. 模式的秘密-观察者模式(四)
  2. 砸500万买学位房,一个焦虑中产的看房日记
  3. Ubuntu中Samba的安装配置和使用[图文]
  4. HDU 1008 Elevator
  5. openstack前世今生
  6. 集群节点间的延迟问题
  7. Juniper Space License Issue on Citrix Xen Environment
  8. [js] axios拦截器原理是什么?
  9. JAVA显示子类num值_JavaSE8基础 子类中的成员变量与父类重名 简单示例
  10. php 5.3.29 怎么开启debug_PHP代码审计之环境安装(一)
  11. 《30天自制操作系统》学习笔记--第好多天
  12. 致远getshell
  13. 橘子origin游戏平台如何绑定登陆验证/二次验证码?
  14. l310加完墨水后需要怎样设置_epsonl310打印机怎么补充墨水?
  15. 论文阅读-2020ICRL-Neural execution of graph algorithms
  16. 【力扣3题】快乐数有效的字母异位词字符串中的单词数
  17. TSINGSEE青犀视频平台人脸识别比对控制比对时间间隔的代码设计
  18. python将excel时间_Python学习笔记(一)Python时间戳与Excel的日期
  19. 谷歌 浏览器二维码显示异常,形成的二维码无法被扫描
  20. bilibili缓存文件在哪里_不要再胡乱清理手机内存,花1分钟删掉这些文件夹,释放大量空间...

热门文章

  1. Oracle 数据恢复指导具体解释
  2. Telerik RadGridView动态增删行及行列操作
  3. HDOJ 3255 Farming(扫描线 + 线段树 体积的并)
  4. “多态枚举”数值如何判断?
  5. 阶段1 语言基础+高级_1-2 -面向对象和封装_9两个引用指向同一个对象空间
  6. BZOJ2212——线段树合并
  7. Gym - 101102C
  8. pycharm 修改新建文件时的头部模板
  9. 每天看一片代码系列(二):WebSocket-Node
  10. Linux下批量添加用户的两种方法