点上方蓝字计算机视觉联盟获取更多干货

在右上方 ··· 设为星标 ★,与你不见不散

编辑:Sophia
计算机视觉联盟  报道  | 公众号 CVLianMeng

转载于 :谷歌,专知

AI博士笔记系列推荐:

博士笔记 | 周志华《机器学习》手推笔记“神经网络”

【导读】从一组图像重建3D对象和建筑物是计算机视觉中的一个广为人知的问题。它在摄影和文化遗产保护中具有多种应用,并为Google Maps中的许多服务提供支持,例如从StreetView和航拍图像创建的3D模型。而在以上应用中,图像通常是由操作员在受控条件下捕获的。虽然这确保了图像中的均匀数据具有统一,高质量的外观以及最终的重建效果,但同时也限制了所捕获站点的多样性。能否不使用严格控制条件下捕获的图像,而互联网上免费提供的大量非结构化图像集合,通过 Structure-from-Motion (sfm)技术来重构?

原文链接:

https://ai.googleblog.com/2020/04/announcing-2020-image-matching.html

为了加快对此主题的研究以及更好地利用已经公开可用的数据,我们提出了“图像匹配:从论文到实践”,这是与UVIC,CTU和EPFL的合作,提出了评估3D重建方法的新公共基准。继在CVPR 2019上举行的首次图像匹配:局部特征及超越研讨会的结果之后,该项目现在包括超过25k图像,每个图像都包含准确的姿势信息(位置和方向)。该数据与开源基准一起公开提供,是在CVPR 2020举行的2020年图像匹配挑战赛的基础。

3D重建

Google地图已经使用了用户拍摄的图像来告知访问者热门地点或更新营业时间。但是,使用这种类型的数据来构建3D模型要困难得多,因为用户拍摄的照片具有不同的视角,光照和天气条件,人和车辆的遮挡物以及滤镜。以下示例突出显示了罗马特莱维喷泉(Trevi Fountain)的图像多样性。

通常,使用SfM重建3D场景首先要确定图像的哪些部分捕获了场景的相同物理点,例如窗口的角点。这是使用局部特征(即可以在不同视图中可靠识别的图像中的显着位置)实现的。它们包含简短的描述向量(模型表示),这些向量捕获了感兴趣点周围的外观。通过比较这些描述符,可以在两个或多个图像上的图像位置的像素坐标之间建立可能的对应关系,并通过三角测量来恢复点的3D位置。然后可以共同估计从中捕获图像的姿势以及所观察到的物理点的3D位置(例如,确定窗口的角相对于相机位置的位置)。在不同图像和点上执行此操作可以重建整个建筑物。

这种方法面临的挑战是存在错误对应关系的风险,例如,由于建筑物的重复结构(例如彼此非常相似的建筑物的窗户)或在图像中无法持久存在的瞬态元素(如人群)。过滤掉它们的一种方法是通过使用多个图像推理对应关系之间的关系。另外一种更强大的方法是设计更好的方法来识别和隔离局部特征,例如,通过忽略诸如人之类的瞬时元素上的点。但是,为了更好地了解SfM的现有局部特征算法的缺点,并为将来的研究提供有希望的方向的见解,必须有一个可靠的基准来衡量性能。

评估3D重建局部特征的基准

局部特征支持许多Google服务,例如图像搜索和Google Lens中的产品识别,并且还用于混合现实应用程序中,例如依赖于传统的手工本地功能的Google Maps的实时视图。设计更好的算法来识别和描述局部特征将总体上带来更好的性能。

但是,比较局部特征算法的性能一直很困难,因为为此目的如何收集“真实”数据并不明显。一些计算机视觉任务依赖于众包:Google的OpenImages数据集通过将机器学习技术与人工标注相结合,用边界框或像素蒙版标记“对象”。在这种情况下这是不可能的,因为不知道先验是什么构成“良好”局部特征,从而使标注不可行。此外,诸如HPatches之类的现有基准通常很小,或者局限于狭窄的转换范围,这可能会使评估产生偏差。

重要的是重建的质量,基准反映了现实世界的规模和挑战,以便强调开发新方法的机会。为此,我们提出了“图像匹配基准”,其中包含用于训练和评估的大型图像数据集。该数据集包括超过25k图像(来自公共YFCC100m数据集),每个图像均已添加了准确的姿势信息(位置和方向)。我们从大规模SfM(每个场景100-1000图片)中获得这种“伪”真相,从而提供准确且稳定的姿势,然后对较小的子集(每个场景10+图片)进行评估。这种方法不需要昂贵的传感器或人工标记,并且比以前的基准测试(仅限于小型且同质的数据集)提供了更好的指标。

END

声明:本文来源于网络

如有侵权,联系删除

联盟学术交流群

扫码添加联盟小编,可与相关学者研究人员共同交流学习:目前开设有人工智能、机器学习、计算机视觉、自动驾驶(含SLAM)、Python、求职面经、综合交流群扫描添加CV联盟微信拉你进群,备注:CV联盟  

最新热文荐读

GitHub | 计算机视觉最全资料集锦

Github | 标星1W+清华大学计算机系课程攻略!

Github | 吴恩达新书《Machine Learning Yearning》

收藏 | 2020年AI、CV、NLP顶会最全时间表!

收藏 | 博士大佬总结的Pycharm 常用快捷键思维导图!

收藏 | 深度学习专项课程精炼图笔记!

笔记 | 手把手教你使用PyTorch从零实现YOLOv3

笔记 | 如何深入理解计算机视觉?(附思维导图)

笔记 | 深度学习综述思维导图(可下载)

笔记 | 深度神经网络综述思维导图(可下载)

总结 | 2019年人工智能+深度学习笔记思维导图汇总

点个在看支持一下吧

Google 发布图片配对基准及挑战:从系列图像重建三维物体和建筑物相关推荐

  1. Google 发布 Cloud AutoML 降低机器学习门槛,调参民工前景堪忧

    翻译 | AI 科技大本营(rgznai100) 参与 | 刘畅.林椿眄 编辑 | 周翔.Donna 本周三,Google 发布了最新的 Cloud AutoML 技术,该技术能使企业开发者们通过 G ...

  2. Google发布新的图像压缩技术,最高可节省75%带宽

    Google发布新的图像压缩技术,最高可节省75%带宽 在社交网络上,每天都有难以计数的图片被人们分享.存储.但有一个现实的问题是,大量的照片由于网络限制被人为压缩降低了画质.而Apple在2010年 ...

  3. Google 发布网页统计报告

    Google发布了网页统计报告,来源于他们索引的42亿个网页 (PageRank高的网站占的权重可能会比较高): * 网页的平均容量是320KB(包含网页里内嵌的脚本.图片.CSS),不过需要注意的是 ...

  4. 新华三首发数字大脑计划;微软进军物联网领域?说好的三星折叠屏发布会,就这样不开了?Google 发布小型芯片 Jacquard...

    关注并标星星CSDN云计算 极客头条:速递.最新.绝对有料.这里有企业新动.这里有业界要闻,打起十二分精神,紧跟fashion你可以的! 每周三次,打卡即read 更快.更全了解泛云圈精彩news g ...

  5. 《大数据》第1期“研究”——大数据管理系统评测基准的 挑战与研究进展(上)...

    大数据管理系统评测基准的挑战与研究进展 钱卫宁,夏 帆,周敏奇,金澈清,周傲英 华东师范大学数据科学与工程研究院 上海 200062 摘要:数据库评测基准在数据库发展历史中的作用不可替代,而大数据环境 ...

  6. 使用Google WebP图片格式帮助控制网站页面大小

    日期:2013-3-16  来源:GBin1.com 不管你相信或者不相信,随着互联网的快速发展网页也在持续不断的变大. 使 网页迅速膨胀的罪魁祸首不是大量使用的JavaScript库,CSS和无尽的 ...

  7. Google发布Android Studio 1.0

     第一个IDE稳定版本:Google发布Android Studio 1.0 摘要:Google于今天发布了Android Studio 1.0,其新增的突出特性包括:首次安装向导方面.示例导入和 ...

  8. Google发布Anthos:Google背书,宣告多集群多云Kubernetes时代已来

    2019独角兽企业重金招聘Python工程师标准>>> 今天, Google Cloud NEXT 2019大会召开,在这场规模三万人的盛会上,Google宣布推出Anthos作为多 ...

  9. Google发布新的TensorFlow物体检测API

    \\ Google发布TensorFlow物体检测API,帮助开发人员和研究人员识别图片中的物体.Google专注于提高API的易用性和性能,新的模型于6月16号发布,在基准测试中表现出良好的性能,并 ...

最新文章

  1. python 链表的反转
  2. 关于nginx配置的不完全总结
  3. openssh的服务端配置文件
  4. 解决Oracle 11g在用EXP导出时,空表不能导出
  5. cornerstone图标含义
  6. HelloWorld的Java代码
  7. PS零基础自学笔记:常见操作方法记录(去水印、抠图、调色调)
  8. python idle界面_3.7 IDLE 用户界面
  9. UNDERSTANDING STRAIGHT-THROUGH ESTIMATOR IN TRAINING ACTIVATION QUANTIZED NEURAL NETS
  10. JavaWeb技术内幕二:Java IO工作机制
  11. 我们应该拥有怎样的职场价值观
  12. 好玩】续航时间提升四倍? 颂拓拓野3 Peak评测
  13. 用php把图片合成视频,图片音乐合成视频 多张图片合成视频|图片合成视频软件...
  14. 顶点计划换位思考汇总
  15. Unity 语音通话功能
  16. 帧结构和物理资源(RB,PRB,VRB,REG,RBG)
  17. 九齐单片机应用-小家电开发(1)
  18. 微信接入智能机器人回复消息
  19. Python笔记:布尔类型,逻辑运算符
  20. Flink CEP在哈啰出行的应用

热门文章

  1. html参考文献_学术规范| 参考文献的格式要求和书写规则
  2. qt4 mysql_qt4连接mysql_MySQL
  3. vue 后端返回文件流下载文件
  4. python 中的列表中最大数怎么求_python 找出list中最大或者最小几个数的索引
  5. mysql语言中有什么运算_SQL知识点,新手感悟
  6. Java发送Post请求,参数JSON,接收JSON
  7. JDK和JRE它们之间的关系及区别
  8. 重拾C,一天一点点_12
  9. 手把手教Jsp上传文件(FileUpload+Servlet)
  10. JS 取当前日期、时间的代码