点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

【导读】对许多人来说,凝视一张城市的旧照片,可以唤起怀旧和好奇的感觉。你有没有想过在20世纪40年代漫步曼哈顿是什么感觉?伴随一个人成长的街道改变了多少?虽然谷歌街景可以让人们看到一个地区现在的样子,但如果你想探索过去的地方是什么样子呢?

为了研究和娱乐目的创造一个有益的「时间旅行」体验,谷歌AI研究院推出了一个基于浏览器的工具集名为「 rǝ」  (发音为 re) 。

这是一个运行在Google Cloud和 Kubernetes 上的开源、可扩展的系统,可以根据历史地图和照片重建城市,这是谷歌今年早些时候推出的开源工具套件的一个实现。

「rǝ」这个前缀的意思是「again or anew」,它代表了这项众包研究工作背后的四个主题:

重建(reconstruction)

研究(research)

娱乐(recreation)

记忆(remembering)

「rǝ」由三个部分组成:

1.一个众包平台,允许用户上传城市的历史地图和地理校正(例如,将它们与真实世界的坐标相匹配) ,并对其进行矢量化。

2.一个时态地图服务器,显示城市地图是如何随时间变化的。

3.一个3D体验平台,通过深度学习,利用有限的历史图像和地图数据重建三维建筑,创建三维体验。

谷歌的目标是使得 「rǝ」可以让历史爱好者虚拟地体验世界各地的历史城市,帮助研究人员、政策制定者和教育工作者的某些工作,并为日常使用者提供一种新的怀旧方式。

「rǝ」使用来自众包的历史地图数据重建街道

重建过去城市的是一个真正的挑战,历史图像数据比现代的图像数据更难处理,因为可用的图像要少得多,从图像中捕获的元数据也要少得多。

为了解决这个问题,「rǝ」模块提供一套开源工具,它们协同工作,创建一个带有时间维度的地图服务器,允许用户使用滑块在时间段之间来回跳转。

这些工具允许用户上传历史印刷地图的扫描版本,地理上校正它们以匹配真实世界的坐标,然后通过追踪它们的地理特征将它们转换为矢量格式。这些向量化的地图随后被提供给一个服务器,并呈现为滑动地图,用户可以放大和平移这些地图。

上面的架构图中,「rǝ」地图模块的入口点是 「Warper」,这是一个网络应用程序,用户可以上传地图的历史图像,并通过在历史地图上找到控制点和基础地图上的相应点来对图像进行地理校正。

下一个模块是「Editor」,允许用户加载地理纠正的历史地图作为背景,然后跟踪他们的地理特征(例如道路等)。这些跟踪数据以开放式街道地图(OSM)矢量格式存储。

然后,它们被转换成矢量块,并从矢量块服务器 Server 应用程序中提供服务。

最后,我们的地图渲染器「Kartta」可以可视化时空矢量,允许用户在历史地图上按照空间和时间来导航。

这些工具建立在包括 OpenStreetMap 在内的众多开源资源之上,所以谷歌希望它们的工具和数据也完全开源。

3D重构「由粗到细」,楼梯的位置也不放过

3D 模型模块旨在利用相关的图像和地图数据重建历史建筑详细的全部3D结构,将这些3D模型合理地组织在一个存储库中,并在历史地图上以时间维度呈现它们。

在许多情况下,建筑物只有一个历史图像,这使得三维重建成为一个极具挑战性的问题。为了应对这一挑战,谷歌开发了一个由粗到精的识别重建算法。

从地图上的「Footprint」和历史图像中的立面区域开始(两者都由众包注释或自动算法检测) ,一个输入建筑物的「Footprint」被向上挤压以生成其粗糙的3D 结构。这个挤压的高度被设置为从地图数据库中相应的元数据的地上层数。

与此同时,3D 重建的pipeline不是直接将每个立面的详细3D 结构推断为一个实体,而是识别所有单独的组成部分(例如,窗口、入口、楼梯等) ,并根据它们的类别分别重建它们的3D 结构。

然后将这些细节化的三维结构与粗糙结构合并,得到最终的三维网格,并将结果存储在一个三维数据库中,可以进行三维渲染。

而支持这一特性的关键技术是一系列最先进的深度学习模型:

1.更快的RCNN,使用每个目标语义类(例如窗口、楼梯等)的外观组件注释进行训练,这些注释用于在历史图像中定位 bounding-box level 的实例。

2.提出了一种语义分割模型,训练该模型为每个语义类提供像素级标签。

3.训练一个专门设计的神经网络来在同一语义类中执行某些高级规则。这确保了立面上生成的窗户间距相等且形状相互一致。这也促进了不同语义类之间的一致性,比如楼梯,以确保它们被放置在合理的位置,并且相对于相关的输入方式具有一致的维度。

图:3D重建的曼哈顿街景

通过 「rǝ」平台,谷歌开发了便于众包的工具来解决重建虚拟城市的时候历史数据不足的主要问题。

这种3D街景的体验仍在进一步完善中,未来会持续更新。谷歌希望「rǝ」作为一个活跃的爱好者和普通用户社区的纽带,不仅利用历史数据集和开源代码,而且积极地为这两者做出贡献。

参考链接:https://ai.googleblog.com/2020/10/recreating-historical-streetscapes.html

编辑:新智元

本文仅做学术分享,如有侵权,请联系删文。

下载1

在「3D视觉工坊」公众号后台回复:3D视觉即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

下载2

在「3D视觉工坊」公众号后台回复:3D视觉github资源汇总即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。

下载3

在「3D视觉工坊」公众号后台回复:相机标定即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配即可下载独家立体匹配学习课件与视频网址。

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、可答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

时空穿越!谷歌利用众包老照片还原儿时3D街景,浏览器即可体验相关推荐

  1. 又有黑科技啦,让老照片还原成彩色!ColouriseSG深度学习上色工具

    先前给各位介绍过 AI Image Enlarger黑科技-人工智能无损放大图片素材不失真 ,相信大家都会人工智能有或多或少的了解吧-今天给大家推荐老照片修复三色工具.相信大家都曾经看过老的照片,不管 ...

  2. 谷歌利用深度学习结合荧光标记,准确预估显微图像

    文章来源:ATYUN AI平台 在生物学和医学领域,显微技术为研究人员提供人肉眼无法观察到的细胞和分子的细节.透射光显微镜能够将生物样本在一边被照亮且成像,技术相对简单,生物样本耐受度高,然而缺点是产 ...

  3. 视差滚动:零基础css代码实现时空穿越效果

    先贴出最终效果: 上面的图片中,底层为冬季大树图片,上层为春季大树图片. 上层元素滚动之间,春季图片的位置却没有变化,感觉像是上层元素的滚动使底层元素的冬季大树图片实现"时空穿越" ...

  4. 量子计算机时空穿越,美俄顶尖专家发现:量子世界时间可以停止,未来穿越时空能做到?...

    原标题:美俄顶尖专家发现:量子世界时间可以停止,未来穿越时空能做到? ​趣味探索讯 不管我们是在消磨时光,还是在努力学习,不管我们是醒着,还是在睡觉,时间齿轮始终无法停止,光阴之箭继续一分一秒地流逝, ...

  5. 量子计算机时空穿越,科学界沸腾!俄美两国科学家竟让时光倒流,未来真能时空穿越?...

    原标题:科学界沸腾!俄美两国科学家竟让时光倒流,未来真能时空穿越? 趣味探索讯 不论你是在工作,还是在休息,不论你是在吃饭,还是在睡觉,时间都在"滴答,滴答"地流逝,而我们也会因为 ...

  6. 无需任何标记数据,几张照片就能还原出3D物体结构,自监督学习还能这样用...

    萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 只给你几张物体的照片,你能准确还原出它在各种刁钻视角下的模样吗? 现在,AI可能比你还原得还要准确. 只给几个3D球的正脸照片: AI立刻就 ...

  7. 本周AI热点回顾:「时空版」Transformer训练速度远超3D CNN;拒绝内卷的AI狼火了!不想抓羊只想躺!...

    ‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍点击左上方蓝字关注我们 01 「时空版」Transformer训练速度远超3D CNN,提速3倍! Facebook AI推出了全新的视频理解架构TimeSform ...

  8. 还原光聚合3D打印技术知多点

    基于还原光聚合方法的3D打印机具有填充有光聚合物树脂的容器,然后用UV光源硬化.还原光聚合3D打印技术都有哪些?让3dlabstore告诉你! 立体光刻(SLA) 该过程中最常用的技术是Stereol ...

  9. PointPillar:利用伪图像高效实现3D目标检测

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 文章导读 计算机视觉任务中,2D卷积神经网络得益于极其出色的性能不断刷新着各大视觉任务的榜单,可谓是Y ...

最新文章

  1. 转:Java学习路线图,专为新手定制的Java学习计划建议
  2. [导入]人的一生能有几天?
  3. 51单片机auxr寄存器_STC12C5A60S2单片机AD采样程序及其寄存器讲解
  4. Sizzle.selectors.match/leftMatch
  5. mysql5.7卸载语句_MySQL5.7完全卸载
  6. 代码生成器插件实现方案征集投票
  7. 【BZOJ4542】大数, 莫队
  8. Javascript基础--对象
  9. 装饰模式/适配器模式/代理模式
  10. Laravel Symfony_Crawler GuzzleHttp 爬虫 抓取行政区域
  11. 坦克大战游戏java代码_Java实现坦克大战游戏的源码示例
  12. 读书笔记:《超越需求 敏捷思维模式下的分析》
  13. 巴特沃斯数字低通滤波器的设计步骤
  14. java 内存分析 工具_Java程序内存分析:使用mat工具分析内存占用 - 王爵的技术博客...
  15. Java根据出生日期计算(判断)星座
  16. 2022-2027年中国星级酒店市场竞争态势及行业投资前景预测报告
  17. 摸爬滚打DirectX11_day02——VS2010+DirectX11的环境配置
  18. 钛磨产品行业调研报告 - 市场现状分析与发展前景预测
  19. android 黑白棋源码,黑白棋源代码
  20. 语音降噪 c语言,使用speex对pcm,wav进行降噪处理

热门文章

  1. list-style 属性 2015-11-5
  2. 未来企业IT选型将更关注社交性(转载)
  3. 大数据分析,在中国,找个身高1米7年入20万的老公,到底有多难?
  4. 只需两步,Tomcat JVM 参数性能迅速调到最优!
  5. Java 程序员必须掌握的 10 款开源工具!
  6. 开源性能监控工具APM之Skywalking和Pinpoint的实测对比
  7. 头条面试归来,有些话想和Java程序员说!
  8. 推荐10个安全又有实力的办公软件,极大提升办公效率
  9. legnano里的看板成员及权限规则?项目成员及规则?
  10. WIFI航模图传模块