安妮 编译整理
量子位 出品 | 公众号 QbitAI

近日,斯坦福大学的研究人员公布了一个数据集,其中包含带有相机姿态的街景数据、8个城市的3D模型和拓展的元数据。这个数据集数据量庞大,街景数据集就包含2500万张图像和1.18亿个匹配的图像对。

数据集可用于学习6DOF相机姿态估计/视觉运动、图像匹配及各种三维估计。比如下面的这个例子:

为了得到这个数据集,斯坦福的研究人员开发了一个系统,整合来自谷歌街景图像和地理元数据的城市间地理信息系统,这其中并不需要人工标注。

城市3D模型

这个数据集涵盖了纽约、芝加哥、华盛顿、拉斯维加斯、佛罗伦萨、阿姆斯特丹、旧金山和巴黎市中心及周边地区。研究人员正逐步放出这些城市的3D模型、街景图片和元数据。模型是通过本身的地理标注和加工生成的生成的,下面是一些3D模型的示例快照。

8个城市中6个城市的覆盖范围如下:

数据集细节

数据集由2500万谷歌街景图像形成的1.18亿数据对组成。研究人员在上述城市的特定区域收集图像,根据城市的3D模型,对外立面密集采样和射线追踪,找到所有街景在无遮挡情况下相同的目标点的全景图。

研究人员掌握了每张图像街景相机的地理位置和目标点的位置。得益于谷歌街景的360度全景图,研究人员计算出镜头方向和俯仰角度,捕捉到一个640x640的全景图像,显示了中心各处的目标点。

如果两张图像显示同一个物理目标点,则配成一对。通常来说,每个目标点通常被2至7个对应的街景图像观察到。一个图像由一个640x640的jpg和命名相同的txt给出,其中包含元数据,例如相机和目标点的地理位置,距离目标的距离或相机角度。因为图像的文件名是街道视图位置和目标点编码的唯一ID,因此能够容易地识别出相应图像。最后,图像被压缩成多个zip文件。

相关论文

这个数据集的相关研究还得追溯到去年。

在2016年欧洲计算机视觉会议(ECCV 2016)上,斯坦福大学的研究人员发表了一篇名为《GENERIC 3D REPRESENTATION VIA POSE ESTIMATION AND MATCHING》论文。

在这篇论文中,研究人员通过解决一组基本的代理3D任务学习通用的3D表示,即以对象为中心的相机姿态估计和宽基线特征匹配。

经过一年多的探索,迄今为止,研究人员已经开发出独立的语义和3D表示,他们在项目网页上表示,研究整合它们的具体技术是一个值得研究的未来方向。

资料下载

GitHub数据集地址:

https://github.com/amir32002/3D_Street_View

斯坦福官方项目介绍:

http://3drepresentation.stanford.edu/

论文地址:

http://cvgl.stanford.edu/papers/zamir_eccv16.pdf

城市3D街景示例:

https://github.com/amir32002/3D_Street_View/tree/master/3D_cities_snapshots

祝你在3D世界玩得开心~

加入社群

量子位AI社群10群开始招募啦,欢迎对AI感兴趣的同学,加小助手微信qbitbot3入群;

此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。

进群请加小助手微信号qbitbot3,并务必备注相应群的关键词~通过审核后我们将邀请进群。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI

վ'ᴗ' ի 追踪AI技术和产品新动态

斯坦福公布3D街景数据集:2500万张图像,8个城市模型 | 下载相关推荐

  1. 厉害了!一本正经地为单身狗推荐这个158万张图像的鉴黄数据集

    本文转自"机器之心"(almosthuman2014) 如果你想训练一个内容审核系统过滤不合适的信息,或用 GAN 实现一些大胆的想法,那么数据集是必不可少的.但限制级图像很难收集 ...

  2. 158万张图像的鉴黄数据集

    机器之心报道 如果你想训练一个内容审核系统过滤不合适的信息,或用 GAN 实现一些大胆的想法,那么数据集是必不可少的.但限制级图像很难收集,也很少会开源.在这个项目中,作者构建了一个大型高质量图像鉴黄 ...

  3. 钢铁表面缺陷检测图像数据集(1800张图像,voc标签)

    <annotation>     <folder>rs</folder>     <filename>0.jpg</filename>    ...

  4. 10万人的1000万张图像,微软悄然删除最大公开人脸数据集

    作者 | 神经小姐姐 转载自HyperAI超神经(ID:HyperAI) 前几日,微软静悄悄地删除了一个公开的名人图片数据集.这个本为世界上最大的公开人脸识别数据集,现在已经不能通过微软的渠道访问. ...

  5. 输电线路防外力破坏图像数据集(1500张图像,VOC标签,5类目标)

    检测目标:1)烟火:2)吊车:3)塔吊:4)导线异物:5)施工机械: 下载地址(3个包,每个不一样):输电线路防外力破坏图像数据集1(500张图像,VOC标签): 输电线路防外力破坏图像数据集2(50 ...

  6. 63万张!旷视发布最大物体检测数据集Objects365 | 技术头条

    编辑 | 琥珀 来源 | AI科技大本营(id:rgznai100) 昨日,在旷视科技联合北京智源人工智能研究院举办的发布会上,旷视研究院发布了物体检测数据集 Objects365,包含 63 万张图 ...

  7. 密恐警告:超2000万张,全球最大的人眼图像数据集开源了

    涵盖 2D 和 3D 特征点.语义分割.3D 眼球注释以及注视向量和眼动类型等因素,德国图宾根大学的研究者创建了全球最大的人眼图像公开数据集--TEyeD. 机器之心报道,作者:杜伟 在当今世界,基于 ...

  8. 63万张!旷视发布最大物体检测数据集Objects365,物体检测竞赛登陆CVPR

    郭一璞 发自 北京会议中心  量子位 报道 | 公众号 QbitAI 比ImageNet大的图像数据集来了. 在4月16日的智源学者计划启动暨联合实验室发布会上,旷视科技发布了通用物体检测数据集Obj ...

  9. 轻松练:如何从900万张图片中对600类照片进行分类|技术头条

    点击上方↑↑↑蓝字关注我们~ 「2019 Python开发者日」7折优惠最后2天,请扫码咨询 ↑↑↑ 作者 | Aleksey Bilogur 译者 | 风车云马 责编 | Jane 出品 | AI科 ...

  10. 如何从900万张图片中对600类照片进行分类,附代码

    作者 | Aleksey Bilogur 译者 | 风车云马 责编 | Jane 出品 | AI科技大本营(公众号id:rgznai100) [导语]完成一个简单的端到端的机器学习模型需要几步?在本文 ...

最新文章

  1. 教你五分钟入门使用html5 svg绘制图形
  2. 2018 年值得关注的 Web 设计趋势
  3. VS2010 C++下编译调试MongoDB源码
  4. DCMTK:DSRDocument类的测试程序
  5. VS2013解决error LNK2019: 无法解析的外部符号 mfcs120ud.lib
  6. C语言 AI智能,五子棋 人机对战,人人对战
  7. win10系统 计算机配置要求高吗,win10流畅配置要求有哪些
  8. c语言-背包问题贪心算法
  9. java学习笔记day14—HTML
  10. WordPress采集插件:QQWorld收藏家豪华版
  11. mysql sum提高效率_MySQL巧建sum索引帮我们提高至少100%的效率
  12. 【转】2023年Java学习路线图-黑马程序员
  13. Oracle的基础知识点汇总
  14. 配置Abaqus2021 + VS2019 + IVF2020编译环境
  15. 阿里开源java调试_阿里开源java诊断工具Arthas
  16. 下载wallheaven壁纸(加入搜索功能)
  17. 线性判别分析的思考与笔记
  18. C#中简单实现多线程
  19. 如何通技术的方法来实现反欺诈?
  20. 网址导航html单文件,GitHub - pizzasheep/OneHtmlNav: 单文件html的网络导航页面,简约并不简单...

热门文章

  1. 数据管理平台DMP细致研究——BlueKai
  2. linux系统外接硬盘_linux系统外接存储管理命令
  3. 金万维未找到服务器信息,域名解析失败原因和问题排查方法
  4. 自助建站工具 搭建出来的网站真的适合SEO吗?
  5. 强制跳过WM调整屏幕的方法
  6. 极简主义、人工智能与Readhub的产品哲学
  7. 浪潮服务器加速计算系统,超强AI计算系统囊括浪潮人工智能服务器
  8. Sql Server排序规则(转)
  9. 分布式订单流水号生成器SequenceNoUtils
  10. excel保存快捷键_这些快捷键,你都知道吗?