点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

我有一张二维照片,能让它变成三维图像么?可以,当前的一些3D电影相册工具,给图片加一个相框也能形成动态效果。

另外,用PS软件,进行一步、两步、三步等等操作后,也可以2D变3D,只不过即使技艺精湛的设计师也需要花费一点时间。

然而,这届的CVPR最佳论文提出了一种无监督的方法,能够常准确地从单目图像中恢复人脸、猫脸和汽车的三维形状。效果如下:

上下左右,前前后后,充分展示了三维图像的“长宽高”☺。重建的三维人脸包含了鼻子、眼睛和嘴的细节,即使在极端的面部表情下表现也非常优秀。

抽象图片与动漫图片也不在话下☝

除了重建三维,二维图像的照明效果也能调一调☝~

无需微调就可逐帧应用,充分实现“你动我也动”☝。

这篇论文也正是因为其提出方法优越的性能和其潜在的应用前景,被选中为CVPR 2020 最佳论文。另外,代码也已经开源。

论文链接:https://arxiv.org/abs/1911.11130

代码地址:https://github.com/elliottwu/unsup3d

项目地址:https://elliottwu.com/projects/unsup3d/

Demo 地址:http://www.robots.ox.ac.uk/~vgg/blog/unsupervised-learning-of-probably-symmetric-deformable-3d-objects-from-images-in-the-wild.html

这篇名为《Unsupervised Learning of Probably Symmetric Deformable 3D Objects from Images in the Wild》的论文由牛津大学的吴尚哲、Christian Rupprecht、Andrea Vedak三位合著。

其中,第一作者是来自香港科技大学2014级的本科生吴尚哲,2018年本科毕业后进入了牛津大学视觉几何组,师从欧洲计算机科学家Andrew Vedaldi,另外,这篇论文的第三作者也是Andrew Zisserman的博士后Andrea Vedaldi。

同样,这项工作也得到了Facebook Research和ERC Horizon 2020研究与创新计划的支持。

1

模型简介与方法介绍

前面也提到,这篇最佳论文最亮的点是:基于原始单目图像学习3D可变形物体类别,而且无需外部监督。

具体而言,其使用的方法是基于一个自动编码器,这个编码器能够将每张输入图像分解为深度、反射率、视点和光照四个组件。整体模型结构如下:

在论文中,作者提到,为了在无监督的情况下分离这些组件,其利用许多物体类别至少在原则上具有对称结构这一事实。

另外,作者通过预测一个对称概率图,对可能对称但不确定对称的物体建模,并与模型的其他组件进行端到端学习。

实验结果表明,作者的方法能够在不需要任何监督和先验形状模型的情况下,非常准确地从单目图像中恢复人脸、猫脸和汽车的三维形状。

在基准测试中,与另一种使用2D图像对应级别的监督方法相比,作者的方法有着优越的准确性。

在具体建模过程中,作者在两种具有挑战性的条件下进行研究,第一个条件是没有2D或3D的ground truth信息(如关键点、分割、深度图或3D模型的先验知识)可用。第二个条件是,该算法必须使用无约束的单目图像集合。

针对这两个条件,作者整体的学习算法过程是:先摄取大量可变形对象类别的单视图图像,然后输出一个深度网络,并且该网络可以根据给定的单一图像估计任何实例的3D形状。

另外,具体的物体实例实际上从来都不是完全对称的,无论是在形状上还是在外观上。由于姿势或其他细节(如发型或面部表情)的变化,形状是不对称的,反射率也可能是非对称的(如猫脸的不对称纹理)。即使当形状和反射率都是对称的,由于不对称的光照,外观仍然可能不对称。

作者用了两种方式解决这个问题。首先,明确地建立光照模型来利用底层的对称性,并表明,通过这样做,模型可以利用光照作为恢复形状的额外线索。其次,扩充模型,以推理物体中潜在的不对称。

值得注意的是,在损失函数方面,作者观察到L1损失函数式对小的几何缺陷敏感,容易导致重建模糊。所以作者添加了一个感知损失项来缓解这个问题。

在训练过程中,作者使用Adam优化器对batch为64的输入图像进行训练,图像大小resize为64×64像素。输出深度和反射率的大小也是64×64。训练大约进行5万次迭代,对于可视化,深度图将上采样到256。

2

实验结果更准确

论文的最后,作者在三个人脸数据集上进行了测试:CelebA、3DFAW和BFM。同时也在猫脸和合成汽车上进行了测试,文章的开头就是部分测试结果,下面是“猫主子”重建结果:

小车重建3D效果:

另外,与完全监督的方法和表现一般的无监督baseline相比,作者的方法在BFM数据集上重建得到的的SIDE误差和MAD误差明显优于baseline并且接近完全监督,如下表损失所示。☟

消融实现性能评估☟

与当前SOTA比较☟

同时,作者在论文的最后也提到了目前工作的限制和不足。

主要有三点,其一如果假设一个简单的Lambertian阴影模型,忽略阴影和镜面反射,这会导致在极端照明条件或高度非Lambertian曲面下的不精确重建,如上图a所示;其二,分离嘈杂的深色纹理和阴影非常困难,如上图b所示;其三,极端姿态下的重建质量较低,如上图c所示。

3

磁灶“95后”一作

前面也提到,这篇CVPR 2020 最佳论文有三位作者,他们都来自牛津大学,其中吴尚哲在2018年从香港科技大学毕业后进入牛津视觉几何组,进行计算机视觉领域的研究。       

当他进入赴牛津大学攻读博士时候,他的家乡晋江对他进行了报道,晋江新闻网说:

年仅22岁的吴尚哲2014年考取香港科技大学,今年以来,他接连收到了牛津大学、苏黎世联邦理工学院、洛桑联邦理工学院的博士项目全额奖学金录取,以及号称“世界计算机第一学府”的美国卡内基梅隆大学硕士项目录取。再过不久,他将前往牛津大学,加入世界顶级的计算机视觉研究组,师从“欧洲计算机科学家”An⁃ drew Zisserman的其弟 子Andrea Vedaldi,致力于人工智能相关研究。

通过晋江新闻的报道,我们也可以看出,他家境并不富裕,父母亲在磁灶社区的老街里经营着一家裁缝店。在他年幼时,全家4口人挤住在一个30平方米的两层老房子里。

贫困的家庭环境中,每日耳濡目染父母亲为了生计的艰辛,培养了他独立自主的能力,更坚定了他奋发学习的决心。

通过努力学习,吴尚哲中学期间获得过全国中学生物理竞赛福建省一等奖,数学竞赛福建省三等奖,以及英语演讲比赛各级奖项等。得益于竞赛获奖的缘故,他获得了保送西安交大的机会,但在一次偶然的机会,他又自己做主报考了香港科技大学。

在香港科技大学读大三时,其就开始跟随导师邓智强和戴宇榮从事计算机视觉相关研究,甚至当时还发表了两篇国际顶级会议论文,并获得出国交流学习的机会。

而如今,我们可以从上面谷歌学术的截图能够看到,吴尚哲已经有了三篇顶会论文,而且都是第一作者。并且,这三篇论文已经有了些引用量。

当初,他远赴牛津大学深造,家乡媒体为他报道,是对他榜样版刻苦学习的认可,如今他能够在几千篇CVPR论文中斩获得最佳论文,则是他不忘初心,持续奋斗,回报家乡的最好礼物。

最后,我们也祝愿这位同学,继续努力学习技能,用知识改变命运,争取早日学有所成,回报社会,回报家乡。

Via http://news.ijjnews.com/system/2018/08/24/011032512.shtml

推荐阅读:

  • 专辑|相机标定

  • 专辑|3D点云

  • 专辑|SLAM

  • 专辑|深度学习与自动驾驶

  • 专辑|结构光

  • 专辑|事件相机

  • 专辑|OpenCV学习

  • 专辑|学习资源汇总

  • 专辑|招聘与项目对接

  • 专辑|读书笔记

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流等微信群,请扫描下面微信号加群,备注:”研究方向+学校/公司+昵称“,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进去相关微信群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近1000+星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、可答疑解惑、助你高效解决问题

“后浪95后”吴尚哲的 CVPR 最佳论文:无需任何监督,即可重建三维图像相关推荐

  1. 后浪“95”获 CVPR 2020 最佳论文,前得主这样解读

    来源 | AI TIME 论道 CVPR 2020已落下帷幕,共计投稿6656篇,录用1470篇,涵盖的方向包括目标检测.目标跟踪.图像分割.人脸识别.姿态估计.三维点云.视频分析.模型加速.GAN. ...

  2. HighNewTech:70后、80后、90后、95后职场人大数据调查(有趣的五个结论)——源于猎聘网

    来看看,作为70后.80后.90后.95后的你,大数据把你分析对了嘛? 目录 70后.80后.90后.95后职场人大数据调查 Q1 Q2 Q3 Q4 Q5 70后.80后.90后.95后职场人大数据调 ...

  3. 【报告分享】85后、95后宝妈人群洞察报告.pdf(附下载链接)

    今天给大家分享Mob研究院出品的<85后.95后宝妈人群洞察报告.pdf>,报告包含如下三大部分: 1.85后.95后宝妈人群现状: 2.85后.95后宝妈用户画像: 3.85后.95后宝 ...

  4. 【2020年领域新星】 吴尚哲 牛津大学

    [2020年领域新星]吴尚哲,牛津大学计算机科学系视觉几何组在读博士.本科毕业于香港科技大学,目前是牛津大学VGG组三年级博士,师从Andrea Vedaldi.研究方向主要为无监督的3D理解.论文& ...

  5. 90后养生,95后养颜,00后抗衰老,“打工人”能靠保健品换个心安吗?

    "今日搬砖不狠,明天地位不稳,早安,打工人."打工人可能是最近最火的一个梗,继"保安日记""社畜"这些自嘲之后,"打工人" ...

  6. vb.net 图片水平翻转_太牛了!98 年后浪科学家,首次挑战图片翻转不变性假设,一作拿下 CVPR 最佳论文提名...

    出品 | AI科技大本营(ID:rgznai100)刚刚结束的CVPR大会,总共收到6424篇论文中,仅有26篇获得最佳论文提名,占0.4%的比例.其中,康奈尔大学大四学生林之秋,以第一作者身份提交的 ...

  7. 80后、90后、95后,哪个才是垮掉的一代?

    15年前, 80后在报纸上与专家辩论"80后是不是垮掉的一代": 10年前, 90后在校内网为自己正名: 5年前, 越来越多的95后在B站发表态度. 转眼, 第一批00后已经奔二. ...

  8. 98年“后浪”科学家,首次挑战图片翻转不变性假设,一作拿下CVPR最佳论文提名​...

    出品 | AI科技大本营(ID:rgznai100) 刚刚结束的CVPR大会,总共收到6424篇论文中,仅有26篇获得最佳论文提名,占0.4%的比例. 其中,康奈尔大学大四学生林之秋,以第一作者身份提 ...

  9. 98 年“后浪”科学家,首次挑战图片翻转不变性假设,一作拿下 CVPR 最佳论文提名​...

    出品 | AI科技大本营(ID:rgznai100) 刚刚结束的CVPR大会,总共收到6424篇论文中,仅有26篇获得最佳论文提名,占0.4%的比例. 其中,康奈尔大学大四学生林之秋,以第一作者身份提 ...

最新文章

  1. python使用fpdf创建pdf文件包含:页眉、页脚并嵌入logo图片、设置使用中文字体
  2. 基于读取车载RFID标签自动开关车库门c#算法实现
  3. [Violation] Added non-passive event listener to a scroll-blocking ‘mousewheel‘ event.
  4. FireBug调试工具笔记
  5. 想成为一个高效的Web开发者吗?来看看大牛分享的经验吧
  6. Centos 6.5下NIS服务安装配置
  7. DDD(Domain-Driven Design)领域驱动设计-(二)事件风暴
  8. php pdo mysql类源码_完整示例php+pdo实现的购物车类
  9. 读《Node入门》笔记
  10. linux 文件句柄 sock,tcp socket文件句柄泄漏
  11. 永久免费的pdf编辑器
  12. Serverless 技术架构 — 初探传说中的FAAS(Function as a Service)
  13. Win10 22H2 19045.2670系统原版镜像
  14. 计算机用户身份识别,计算机用户身份识别装置及使用方法与流程
  15. 面试官: 你知道 JWT、JWE、JWS 、JWK嘛?
  16. 医学统计学 第八章( t 检验)
  17. LayoutManager布局管理器:FlowLayout、BorderLayout、GridLayout、GridBagLayout、CardLayout、BoxLayout
  18. “AV终结者”预防方法
  19. 将0.1101101*2^(-10)表示成阶码用4位移码、尾数用8位原码(含符号位)的浮点数
  20. Android Native层错误调试

热门文章

  1. DM***+EZ***
  2. 在普通PC上安装XENSERVER 6.2
  3. 游戏开发--开源21---CroftSoft Code Library |Gibdo|JOGR...
  4. 论坛社区做推广要精心的策划
  5. RHEL系统启动流程
  6. ASP.NET Ajax替代品AjaxWidgets
  7. MySQL基础篇:单行函数
  8. Kubernetes 必备工具:2021
  9. 大型商业银行数据库连接池选型策略
  10. 秒杀系统架构分析与实战,一文带你搞懂秒杀架构!