晓查 发自 凹非寺
量子位 报道 | 公众号 QbitAI

看到下面这张动图,你会想到什么?是谷歌地球,还是苹果自带的3D地图?

其实都不是,它是用卫星和航拍图片直接渲染生成的洛杉矶。

很难想象,如此精细的城市3D模型,竟然是用几张不同角度和高度的2D图片重建的。

这项研究来自香港中文大学多媒体实验室团队,叫做CityNeRF

说到这里,有人应该想到了这两年大热的“神经辐射场”(NeRF),它可以用多张角度照片重建3D对象,性能出色。量子位之前对此进行了相关报道和解读。

NeRF虽然恢复室内场景效果惊艳,但是直接用到城市级的卫星地图上,却面临着巨大的挑战。

首先是拍摄相机有很大的运动自由度。随着相机的上升,场景中的地物外观越来越粗糙,几何细节越来越少,纹理分辨率越来越低。

同时,随着空间覆盖范围的扩大,来自外围区域的新对象会加入到视图中。

相机在这个一系列场景中,产生了具有不同细节级别和空间覆盖范围的多尺度数据。

如果使用原来的NeRF渲染,那么生成的远景往往不完整,周边场景区域存在伪影,近景总是具有模糊的纹理和形状。

什么原理?

针对上述问题,作者提出了采用多阶段渐进式学习范式的CityNeRF。

作者根据相机距离将整个训练数据集划分为预定义数量的尺度。从最远的尺度开始,每个训练阶段逐渐将训练集扩大一个更近的尺度,并同步增长模型。

通过这种方式,CityNeRF可以稳健地学习跨场景所有尺度的表示层次结构。

CityNeRF引入了两个特殊的设计:

1、具有残差块结构的生长模型:

在每个训练阶段附加一个额外的块来扩展模型。每个块都有自己的输出head,用于预测连续阶段之间的颜色和密度残差,促使块在近距离观察中关注新兴细节;

2、包容的多级数据监督:

每个块的输出head由从最远尺度到其对应尺度的图像联合监督。

换句话说,最后一个块接受所有训练图像的监督,而最早的块只暴露于最粗尺度的图像。通过这样的设计,每个块模块都能够充分利用其能力,在更近的视图中对复杂的细节进行建模,并保证尺度之间一致的渲染质量。

总体来说,CityNeRF是一种渐进式学习范式,可同步增长NeRF模型和训练集。从用浅基块拟合远景开始,随着训练的进行,添加新的块以适应越来越近的视图中出现的细节。

该策略有效地激活了位置编码中的高频通道,并随着训练的进行展开更复杂的细节。

简而言之,使用基本神经网络多层感知器的权重,NeRF将提前处理所有图像,知道其观点位置。NeRF将使用相机的光线找到每个像素的颜色和密度。

因此,它知道相机的方向,并可以同时使用所有数组来了解深度和相应的颜色。然后,使用损失函数优化了神经网络的收敛性,

模型训练数据数据来自Google Earth Studio中的12个城市图像。结果显示在几种常见重建模型中达到了最佳的效果。

最后,作者又将该模型用于重建无人机拍摄的空中图像,依然收到了更佳的效果。

团队简介

本篇论文的两位一作是来自香港中文大学MMLab的两位博士生相里元博徐霖宁。前者曾有一篇论文被ICLR 2020收录,后者有多篇论文被CVPR、ICCV等顶会收录。

通讯作者是以上两位的导师林达华

林达华是香港中文大学信息工程系副教授,也是港中大-商汤科技联合实验室主任。

论文地址:
https://arxiv.org/abs/2112.05504

项目地址:
https://city-super.github.io/citynerf/

卫星图片重建洛杉矶3D模型,效果就像谷歌地球,港中大团队提出CityNeRF相关推荐

  1. canvas绘制城市3D模型效果

    下载地址canvas绘制城市3D模型效果HTML5代码,款3D酷炫的城市建筑模型,鼠标长按或拖动穿过建筑模型动画特效. dd:

  2. 去除冗余token的DETR效果怎么样?NUS颜水成团队提出端到端的PnP-DETR结构

    ​作者丨happy 编辑丨极市平台 本文原创首发于极市平台,转载请获得授权并标明出处. 原文链接:https://arXiv.org/abs/2109.10852 语言模型与目标检测这种八竿子打不着的 ...

  3. 【Android界面实现】可旋转的汽车3D模型效果的实现

    转载请注明出处:http://blog.csdn.net/zhaokaiqiang1992 今天要给大家介绍的是如何实现可旋转的汽车3D模型. 先看实现效果 这只是静态图,实际上,这个模型是可以根据手 ...

  4. 可旋转的汽车3D模型效果的实现

     转载请注明出处: http://blog.csdn.net/zhaokaiqiang1992 今天要给大家介绍的是如何实现可旋转的汽车3D模型. 先看实现效果 这只是静态图,实际上,这个模型是可 ...

  5. 微信小程序AR扫描识别图(支持多图片)加载3D模型及其动画

    MP-EasyAR-3DModels-Animations For Instance *微信公众平台* *微信开发者工具* *EasyAR* *项目实践* *下载文件到本地* *扫描识别* *加载模型 ...

  6. 一张照片就能生成3D模型,GAN和自动编码器碰撞出奇迹,苏黎世联邦理工学院出品...

    萧箫 发自 凹非寺 量子位 | 公众号 QbitAI 2D图片"脑补"3D模型,这次真的只用一张图就行了-- 只需要给AI随便喂一张照片,它就能从不一样的角度给你生成"新 ...

  7. 实现扫描图片出现3d模型的虚拟仿真技术

    前期配置 unity2017 软件实现功能准备 数据库的准备 登录到vuforia的官网并且sign in 点击 Get Basic创建一个Liscense Key. 进入已经创建的Liscense ...

  8. “3DH5”随手分享你的3D模型

    这几年,3D模型在设计和展示产品中已经屡见不鲜了,因为它能带来很酷炫的效果. 麦当劳早在2015年就做出了不错的 3D 广告. 淘宝也是紧跟潮流. 地产和各种影视节目的片头也很爱用3D建模的形式来表现 ...

  9. 【pano2vr】网页Flash中简单实现炫酷的3D模型制作

    花了两天时间学习如何能够高效的实现3D模型效果,毕竟是从0开始学习,感觉pano2vr这款软件挺容易上手,并且可以很容易实现简单的热点交互,可以根据交互需求设置皮肤,故将这一款软件推荐给大家: 1.简 ...

最新文章

  1. 巴菲特:买进你同学的10%
  2. 【PC工具】一个好用的评分很高的文件管理器Files
  3. windows phone7 学习笔记15——Bing Maps
  4. c语言一个一个读取文件字节,C语言中二进制文件的读取
  5. 手把手教你使用Pandas读取结构化数据
  6. proguard java enum,Proguard没有这么说就不会混淆课堂
  7. python入门——列表+元组+字典+集合
  8. 利用Docker搭建Redis集群
  9. 医药公司java,医药管理系统java版
  10. 股票软件开发中全推与点播的区别(自己留作记录的,请csdn的小编别乱删我的文章)...
  11. 用例不全,质量如何保证?
  12. 阶段3 1.Mybatis_07.Mybatis的连接池及事务_5 mybatis中使用poolead配置连接的原理分析...
  13. 【北京迅为】i.MX6ULL终结者Linux RS232/485驱动实验RS232驱动
  14. 如何拼局域网所有ip_如何ping局域网内所有IP
  15. notepad++中文版下载
  16. Struts2通配符问题
  17. pytorch_预训练Se_resnet50_自定义类别数量_源码分享
  18. python Calendar日历模块函数介绍
  19. Wifi文件传输项目总结
  20. 双光子荧光成像_为什么双光子成像如此重要?

热门文章

  1. 无限的Bash历史[关闭]
  2. 如何检测链表中的循环?
  3. Why I Love My Virtual PCs
  4. 使sqoop能够启用压缩的一些配置
  5. 201521123009 《Java程序设计》第10周学习总结
  6. 如何基于MySQL及Redis搭建统一的kv存储服务 | 秦波
  7. 关于导入My97DatePicker时间插件遇到的问题及解决方案
  8. ambari初始化登陆账号/密码假如不是admin/admin
  9. iOS中判断程序是不是第一次运行(新手引导界面用)
  10. 亿科影视管理系统1.2.0版以及1.0版本均有后门