点击上方“3D视觉工坊”,选择“星标”
干货第一时间送达作者丨AI_stduy
来源丨 AI算法与图像处理

大家好,我是阿潘,今天给大家分享一篇最新的成果NeROIC,号称可以从在线图像集合获取对象表示的新方法,从具有不同相机、照明和背景的照片中捕获任意对象的高质量几何和材料属性!

太牛了吧,不得不说今年的NeRF相关的工作特别多,效果非常的惊艳 !元宇宙又加一分!

论文标题:

NeROIC: Neural Object Capture and Rendering from Online Image Collections

论文和主页链接(代码链接未公布):

https://arxiv.org/abs/2201.02533

https://formyfamily.github.io/NeROIC/

效果:

借助材质属性,我们能够使用新的光照环境重新渲染对象,结果如图 8 所示。

即使我们的输入图像是在完全不同的环境中捕获的,我们的模型也能处理这项具有挑战性的任务,产生高质量和合理的合成结果。

摘要

我们提出了一种从在线图像集合中获取对象表示的新方法,从具有不同相机、照明和背景的照片中捕获任意对象的高质量几何和材料属性。这使得各种以对象为中心的渲染应用程序成为可能,例如从具有挑战性的野外输入中获得新颖视图合成、重新照明和协调背景合成。使用扩展神经辐射场的多阶段方法,我们首先推断表面几何形状并细化粗略估计的初始相机参数,同时利用粗略的前景对象掩码来提高训练效率和几何质量。我们还引入了一种稳健的法线估计技术,该技术消除了几何噪声的影响,同时保留了关键细节。最后,我们提取表面材料属性和环境照明,以球谐函数表示,并带有处理瞬态元素的扩展,例如锐利的阴影。这些组件的结合产生了一个高度模块化和高效的对象获取框架。广泛的评估和比较证明了我们的方法在捕获对渲染应用程序有用的高质量几何和外观属性方面的优势。

整体思路

框架图:

给定一组粗略校准的图像和相应的前景蒙版,我们的几何网络计算具有静态和瞬态分量的神经辐射场,并细化相机参数 (a)。然后,我们基于网格的法线提取层从学习的密度场 (b) 中估计表面法线。最后,我们修复了物体的几何形状,并在渲染网络中使用估计的法线作为监督,在其中我们推断照明条件(表示为球谐系数)、表面材料属性(使用 Phong 渲染模型)和高 质量表面法线 (c)。

具体来说:

这里的两阶段模型将来自不同条件的对象图像作为输入。利用其他 state-of-the-art 方法获取的图像的相机位姿和对象前景蒙版,我们首先通过训练基于 NeRF 的网络优化扫描对象的几何形状并细化相机位姿;然后我们使用我们的法线提取层从几何体(由密度函数表示)计算表面法线;最后,我们的第二阶段模型分解了物体的材料属性,并解决了每个图像的光照条件。

本文仅做学术分享,如有侵权,请联系删文。

3D视觉精品课程推荐:

1.面向自动驾驶领域的多传感器数据融合技术

2.面向自动驾驶领域的3D点云目标检测全栈学习路线!(单模态+多模态/数据+代码)
3.彻底搞透视觉三维重建:原理剖析、代码讲解、及优化改进
4.国内首个面向工业级实战的点云处理课程
5.激光-视觉-IMU-GPS融合SLAM算法梳理和代码讲解
6.彻底搞懂视觉-惯性SLAM:基于VINS-Fusion正式开课啦
7.彻底搞懂基于LOAM框架的3D激光SLAM: 源码剖析到算法优化
8.彻底剖析室内、室外激光SLAM关键算法原理、代码和实战(cartographer+LOAM +LIO-SAM)

9.从零搭建一套结构光3D重建系统[理论+源码+实践]

10.单目深度估计方法:算法梳理与代码实现

11.自动驾驶中的深度学习模型部署实战

12.相机模型与标定(单目+双目+鱼眼)

13.重磅!四旋翼飞行器:算法与实战

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、激光/视觉SLAM自动驾驶等)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近4000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

南加大提出NeROIC:还有什么不能渲染的?重建效果太强悍了相关推荐

  1. ECCV 2022 | 清华腾讯AI Lab提出REALY:重新思考3D人脸重建的评估方法

    ©作者 | 人脸人体重建 来源 | 人脸人体重建 本文分享 ECCV 2022 论文<REALY: Rethinking the Evaluation of 3D Face Reconstruc ...

  2. ICCV 2019 | 清华等联合提出高精度、高效率点云3D重建网络框架PointMVSNet

    点击我爱计算机视觉标星,更快获取CVML新技术 机器之心发布 作者:Rui Shen.Songfang Han.Jing Xu.Hao Su 本文介绍了一种基于点云的 MVS 神经网络框架 Point ...

  3. keyshot渲染图文教程_keyshot渲染图文教程,教你如何渲染冰的效果

    keyshot渲染图文教程,教你如何渲染冰的效果 众所周知keyshot渲染效果非常出色,能够完美的表现出产品的材质和纹理效果,产品设计师的渲染高清图基本可以获得客户的青睐,一方面是对于产品创意的认可 ...

  4. 3dmax:3dmax三维VR渲染设置之高级灯光渲染(经典案例—VR灯光渲染房间天光效果)图文教程

    3dmax:3dmax三维VR渲染设置之高级灯光渲染(经典案例-VR灯光渲染房间天光效果)图文教程 目录 VR灯光渲染房间天光效果 VR灯光渲染房间天光效果

  5. 解决Vue用v-html、v-text渲染后台富文本框文本内容样式修改问题,用自定义css样式无法渲染出对应效果的问题

    举例: 如果您要加载富文本框内容的DOM id是detail 那么就这么写scss样式 #detail {font-size: 14px;text-align: center;&>> ...

  6. 一年六篇顶会的清华大神提出Fastformer:史上最快、效果最好的Transformer

    来源:新智元 [导读]Transformer模型好是好,可惜太慢了!最近一位清华大神在arxiv上传了一篇论文,提出新模型Fastformer,线性时间复杂度,训练和推理效率史上最快,还顺手在排行榜刷 ...

  7. USC提出拟牛顿法深度学习优化器Apollo,效果比肩SGD和Adam

    ©作者 | Xuezhe Ma 单位 | USC助理教授 研究方向 |NLP.机器学习 摘要 本文介绍了 Apollo,一种针对非凸随机优化的拟牛顿方法.它通过对角矩阵逼近 Hessian,动态地将损 ...

  8. vivo S10系列官方渲染图公布 外壳太好看了!

    与往年一样,年中时刻各大手机厂商都在为下半年的顶级旗舰进行最后的冲刺,因此在这期间往往是中端机型的天下.现在有最新消息,近日vivo官微悄然更换了微博封面图,图中一款名为vivo S10的机型的正反两 ...

  9. [PBRT-V3]怎么对比不同渲染算法的效果

    面对不同的渲染算法,比如:PT.BDPT.PM.SPPM.Original MLT.PSSMLT.MMLT等等,对比不同渲染算法效果的常用方式是:相同时间下,渲染图片的质量(或者,渲染相同质量图片所需 ...

最新文章

  1. 业界 | 德勤预测:机器学习走向移动端成大势所趋,或将再掀行业新浪潮
  2. [学习笔记]matlab
  3. Gson将字符串转map时,int默认为double类型
  4. 《研磨设计模式》chap12 观察者模式observer(3)例子
  5. LeetCode 38外观数列39组合总和
  6. 华为云推出新冠肺炎AI辅助诊断服务,CT量化结果秒级输出
  7. dev 域名与 Chrome
  8. 【Leetcode 795】Number of Subarrays with Bounded Maximum
  9. Mysql Linux安装详细步骤
  10. 用 Python 处理 HTML 转义字符的5种方式
  11. origin 复制与数据转置
  12. 反编译工具jd-gui、luyten学习使用
  13. B150主板Win7系统出现蓝屏且提示错误代码0x000000C5的原因及解决方法
  14. PAT初级1031(C++)查验身份证
  15. 三星GalaxyTab3 7.0(WIFI) SM-T210 刷机 ROM 教程 附带港版官方ROM
  16. 我的大学六年 郭天祥
  17. 《Cloud Native Data Center Network》读书笔记-1
  18. leetcode刷题----祖玛游戏(14)
  19. ddr2是几代内存_如何区分DDR1 DDR2 DDR3内存条
  20. 指针详解(包含指针,指针数组,数组指针,指向数组指针的指针,函数指针,函数指针数组,指向函数指针数组的指针)

热门文章

  1. Apache2.2安装图解
  2. 在线抓图WebSnap Beta 1.2 更新
  3. Vmware的 管理工具概述
  4. webservice中cxf框架的HelloWord
  5. Covariance and Contravariance in C#的搜索条件
  6. 大学毕业生如何应对“没有工作经验”的难题
  7. 【原】开源——基于文件驱动的站点开发
  8. JVM:垃圾回收相关概念
  9. JVM:垃圾回收概述
  10. leangoo敏捷工具卡片关联上线