编辑丨三次方AIRX

三次方

学员

AR/VR的关键技术 - 三维重建,我是算法工程师,最近负责公司XR方面的算法工作。班班有没有什么好的框架或者数据集供学习参考呢?

最近Facebook AI 开源 CO3D(3D 中的常见对象)数据集,用于计算机视觉研究中的 3D 重建

3D熊

CO3D - 三维重建数据集

3D对象重建是 AR/VR 技术应用的重要计算机视觉问题(eg:远程呈现和游戏 3D 模型的生成)用于逼真 3D 重建的新兴技术可以将真实物体与传统智能手机、笔记本电脑甚至未来增强现实眼镜上的虚拟物体无缝混合。

总而言之,当前的 3D 重建方法依赖于各种对象类别的学习模型,由于缺乏包含真实世界对象视频和准确 3D 重建的数据集,这些模型是有限的。由于模型使用这些示例来创建足够的重建,因此研究人员通常只使用本质上具有近似匹配的合成对象。

Facebook AI部门发布了一个大规模数据集,其中包含带有 3D (CO3D) 注释的常见对象类别的真实视频。新的 CO3D 拥有来自近 19,000 个视频的 150 万帧,这些视频捕获了广泛使用的 MS-COCO 数据集中 50 种不同类型的对象,以提高准确性和覆盖范围。

Facebook AI 也发布了一种他们称之为 NeRFormer 的新方法的成果。它可以通过观察 CO3D 数据集中的视频(而不仅仅是静止图像)来学习从不同视角合成物体的图像。这实现了结合最近两个机器学习贡献的高效合成:变压器和神经辐射场,在为对象生成新视图时,与最接近的竞争对手的方法相比,准确度提高了 17%。

三次方

学员

看起来不错哇,能简单介绍下原理或者过程嘛?

妥,没有问题,往下看:

3D熊

为了收集用 3D 形状标注的野外常见物体的大规模现实生活数据集,Facebook AI 研究人员设计了一种摄影测量方法,只需要以物体为中心的多视图图像。

为了实现这一目标,他们在 Amazon Mechanical Turk (AMT) 上众包了以对象为中心的视频。每个 AMT 任务都要求工作人员在给定类别中选择一个对象,将其放置在固体表面上,并在围绕整个对象移动的同时录制视频。他们选择了 50 个 MS-COCO 类别,包括具有明确定义的形状的静止物体,它们是成功 3D 重建的良好候选者。

成熟的摄影测量框架 COLMAP 使用 3D 注释并跟踪相机以创建密集的对象点云。为了确保高质量的 3D 注释,作者对精度较低的视频使用了主动学习算法。

除了CO3D数据集的发布,Facebook AI还提出了NeRFormer。这是一种新颖的深度架构,通过差异化渲染其神经辐射场 (NeRF) 进行学习。这些属性是基于分析视频内容并沿着光线行进以进行渲染来预测的。因此,一旦神经形成器学习了一个类别的共同结构,它就可以合成一个不可见对象的新视图,只给出它的已知视图。

CO3D 数据集将是同类中的第一个,它已经对 3D 现实生活对象重建产生了重大影响。它为他们的 NeRFormer 提供训练数据,以处理新视图合成 (NVS) 任务。借助逼真的 NVS,它们离完全身临其境的 AR/VR 效果又近了一步。

三次方

学员

Get!代码和论文下载有吗?

1、数据集下载地址:

https://ai.facebook.com/datasets/co3d-downloads/

2、代码地址:

https://github.com/facebookresearch/co3d?

3、论文下载:公众号回复【CO3D】

3D熊

本文仅做学术分享,如有侵权,请联系删文。

下载1

在「3D视觉工坊」公众号后台回复:3D视觉即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

下载2

在「3D视觉工坊」公众号后台回复:3D视觉github资源汇总即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。

下载3

在「3D视觉工坊」公众号后台回复:相机标定即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配即可下载独家立体匹配学习课件与视频网址。

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、orb-slam3等视频课程)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

三维重建缺数据集?来看看Facebook最新发布的CO3D相关推荐

  1. Facebook 最新力作 FBNetV3来了!相比 ResNeSt 提速 5 倍,精度不输 EfficientNet

    原文链接:Facebook 最新力作 FBNetV3来了!相比 ResNeSt 提速 5 倍,精度不输 EfficientNet FBNetV1:https://arxiv.org/abs/1812. ...

  2. matlab 按字母排序,matlab命令大全(按字母排序) 总汇详解最新发布完整珍藏版

    matlab命令大全(按字母排序) 总汇详解最新发布完整珍藏版 abs 绝对值.模.字符的ASCII码值 acos 反余弦 acosh 反双曲余弦 acot 反余切 acoth 反双曲余切 acsc ...

  3. 最新发布:2022斯坦福AI指数报告

    文章目录 最新发布:2022斯坦福AI指数报告 Part 1:2022 AI指数报告八大要点 1.AI领域的私人投资飙升,投资集中度加剧. 2.美国和中国主导AI跨国合作. 3.语言模型更强大,但也更 ...

  4. Facebook AI 发布“HuBERT”:一种学习自我监督语音表示的新方法

    许多人工智能研究项目一直在努力提高他们仅仅通过倾听和与他人互动来检测和解释语音的能力,就像婴儿学习他们的第一语言一样.这不仅需要评估某人所说的话,还需要从这些话的表达方式中获得各种其他线索,例如说话人 ...

  5. 自然机器人最新发布:智能流程助手,与GPT深度融合

    ChatGPT自2022年11月上线后就受到现象级地广泛关注,5天时间用户就已经突破百万,仅2个月时间月活用户就突破1亿,成为史上增速最快的消费级应用,远超TikTok.Facebook.Google ...

  6. facebook 获取头像_每当您的朋友在Facebook上发布任何内容时,如何获取通知

    facebook 获取头像 If you want to stay on top of your friend's Facebook activity with the same kind of al ...

  7. Facebook最新Libra币开发指南---接口服务器开发2

    Facebook最新Libra币开发指南---接口服务器开发2 2019年06月24日 16:23:16 最老程序员闫涛 阅读数 1145 在上一篇博文中,我们已经使用Rust语言开发了一款简单的We ...

  8. 分享10个2012年最新发布的jQuery插件

    为什么80%的码农都做不了架构师?>>>    日期:2012-5-9  来源:GBin1.com 本文收集了最新的jQuery社区发布的jQuery插件,绝对是你没有见过的,希望大 ...

  9. IDC最新发布全屋智能将成为智能家居增长的重要动力,华为战略升级

    国际数据公司(IDC)最新发布的<中国智能家居设备市场季度跟踪报告>显示,2021年上半年中国智能家居设备市场出货量约1亿台,同比增长13.7%:2021全年出货量预计2.3亿台,同比增长 ...

最新文章

  1. 初学者用涩性胶皮好还是粘性_乒乓球胶皮的保养方法
  2. 2021第六届数维杯大学生数学建模竞赛赛题_B 中小城市地铁运营与建设优化设计
  3. 【实用】SAP Call Transaction下钻功能大全
  4. MySQL约束和修改数据表知识集结
  5. win10支持linux内核,Win10将允许您加载自定义Linux内核
  6. JAVA进阶day07JNI(java调用c)B部分
  7. Vue 之 slot(插槽)
  8. 计算几何——圆卡精度cf1059D
  9. EMC业务连续性和容灾服务
  10. 嵌入式Linux系统编程学习之十二守护进程
  11. 解决 ImportError: No module named ‘pip._internal‘问题
  12. ftp工具哪个好,推荐8个超级好用而且免费的ftp工具,支持中文版windows系统的。
  13. electron快捷键
  14. PureMVC框架知识介绍
  15. Python 根据起始时间和结束时间计算时长
  16. 想撩产品小姐姐?你必须学会的这篇产品经理必读文章,如何构建电商产品认知体系?
  17. 从前端技术到体验科技(附演讲视频)
  18. android /linux休眠与唤醒(一)
  19. 【数据库】编写存储过程
  20. 花菁染料(cas773041-79-5|cas427882-78-8|cas14134-81-7)结构图及合成路线图

热门文章

  1. 安卓手机上 js不能控制微信浏览器强制刷新页面
  2. DevExpress最强干货|实用示例、更新等你来体验!
  3. UISegmentControl
  4. 设计模式模式游客(Visitor)摘录
  5. 静态方法static 的了解
  6. java中的IO操作总结(一)
  7. 【SQL Server数据迁移】链接服务器、分布式查询
  8. DNS Serv管理与维护
  9. Nginx+keepalived 实现高可用,防盗链及动静分离配置
  10. Redis 秒杀实战