视频地址:在公众号「3D视觉工坊」,后台回复「谷歌X实习生」,即可直接下载。

最近,谷歌X的实习生Bowen Wen新开源了用于6D物体姿态跟踪的代码BundleTrack,该工作已经被今年的IEEE/RSJ International Conference on Intelligent Robots and Systems(IROS)录用。其中Bowen Wen为该论文唯一学生作者,此前也是se(3)-TrackNet的第一作者(目前state of art的基于CAD模型的6D姿态跟踪算法),目前为美国Rutgers大学的在读博士,过去几年曾在Facebook Reality Labs, 亚马逊和商汤科技实习。

以下是新开源代码相关的论文、视频、代码、作者个人主页等信息

论文名称:BundleTrack: 6D Pose Tracking for Novel Objects without Instance orCategory-Level 3D Models

论文下载:

https://arxiv.org/pdf/2108.00516.pdf

代码链接:

https://github.com/wenbowen123/BundleTrack

作者Github主页:

https://github.com/wenbowen123

贡献

该开源项目主要贡献如下

1.  一个全新的6D物体姿态算法,不需要实例或类级别的CAD模型用于训练或测试阶段。该算法可立即用于新颖物体的6D姿态跟踪

2.  在NOCS数据集上的创下全新记录,将以往的表现从33.3%大幅度提升到87.4%。在YCBInEOAT数据集上也达到了跟目前基于CAD模型的领先方法se(3)-TrackNet相近的表现。特别值得注意的是,与以往state of art的6D物体姿态跟踪方法相比,BundleTrack并不需要类级别的物体进行训练,也不需要测试阶段物体的CAD模型作模板匹配,减少了很多假设。

3.  首次将具有记忆功能的位姿图优化引入6D物体姿态跟踪。除了相邻帧的匹配还能够借助带记忆功能的历史帧解决特征匹配不足和跟踪漂移问题。

4.  高效的CUDA编码,使得本来计算量庞大的位姿优化图能在线实时运行,达到10Hz。足够用于AR/VR,视觉反馈控制操纵,物体级SLAM或动态场景下的 SLAM等。

问题设置

对于需要6D跟踪的物体,该方法不需要任何类级别的CAD模型或者当前物体的CAD模型。所需要的输入只有(1)RGBD视频;(2)初始掩码,用于指定需要跟踪的物体。该掩码可以通过多种途径获得,例如语义分割,3D点云分割聚类,平面移除等等。该方法就能输出跟踪物体在相机前相对初始的6D姿态变换。

方法

1)总览

本文所提出的 BundleTrack 框架的概述如图. 当前观察到的 RGB-D 帧

谷歌最新开源BundleTrack: 无需任何CAD模型的6D物体姿态跟踪算法相关推荐

  1. 美国Rutgers大学最新开源:端到端6D物体姿态跟踪,无需标注数据集!

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 最近,美国Rutgers大学PRACSYS Lab新开源了用于6D物体姿态跟踪的代码Se(3)-Tra ...

  2. BundleTrack:无需实例或类级别3D模型的6D姿态跟踪算法(IROS2021)

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨paopaoslam 来源丨泡泡机器人SLAM 标题:BundleTrack: 6D Pose ...

  3. CNN 与 Transformer 的强强联合!谷歌最新开源 BoTNet,ImageNet 达 84.7%准确率

    Conv+Transformer=BotNet,这是伯克利.谷歌最新提出的工作BotNet,它充分利用了CNN与自注意力的优势,在ImageNet上取得了84.7%的top1精度,同时文中各种实验分析 ...

  4. 谷歌最新开源前端框架了解一下?前端小白都能看懂的8本书

    导读:跨平台.免费.开源,谷歌又搞"大新闻"?谷歌最新前端开发框架Flutter1.0版本已发布,可以极速构建漂亮的原生应用.各位前端大神都在用什么开发?下面八本书会帮助你快速入门 ...

  5. 最新综述:基于深度学习方式的单目物体姿态估计与跟踪

    原文:Deep Learning on Monocular Object Pose Detection and Tracking: A Comprehensive Overview 作者:中国人民大学 ...

  6. CVPR 2020|开源实时“人手-物体”姿态估计算法HOPE-Net

    向大家安利一篇CVPR 2020的论文 HOPE-Net: A Graph-based Model for Hand-Object Pose Estimation,基于自适应图卷积技术,作者提出了一种 ...

  7. 谷歌 | 最新110亿参数的T5模型17项NLP任务霸榜SuperGLUE!

      新智元报道   来源:github 谷歌在最新发布的论文<Exploring the Limits of Transfer Learning with a Unified Text-to-T ...

  8. 【干货】CNN与Transformer的强强联合!谷歌最新开源BoTNet,ImageNet达84.7%准确率

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 作者丨Happy 审稿|邓富城 编辑丨极市平台 本文是伯克利与谷歌的 ...

  9. 谷歌最新开源的工具可以自动化查找并修复 bug!

    作者 | h4cd 本文经授权转自开源中国 近日,谷歌开源了一个模糊测试基础设施--ClusterFuzz,可以非常简单地自动化查找并修复程序中的 bug. 模糊测试是一种用于自动化检测软件中存在的问 ...

最新文章

  1. 《C++面向对象高效编程(第2版)》——3.11 类名、成员函数名、参数类型和文档...
  2. Centos7网络正常,但使用yum提示安装源无法连接
  3. android中SELINUX规则分析和语法简介
  4. ES6新特性之修饰器
  5. 使用AWS Lambda,S3和AWS CloudFront进行动态内容缓存
  6. 一个具自我复制功能的程序
  7. 必须掌握的30种SQL语句优化
  8. 求各位大神帮忙看一下我用51做的万年历程序有没有问题
  9. Volatility2.6用法
  10. ONLYOFFICE支持wps格式文件(wps,et,dps)的协作
  11. 干货 | 带你解锁AC/DC、DC/DC转换器基础
  12. 马尔科夫随机场(MRF)与吉布斯分布(Gibbs)
  13. uni-app项目(首页)
  14. NDCG介绍、实现及在推荐系统中的应用实践
  15. 警惕“黑洞效应”?汽车芯片的“扩张”和主机厂的“枷锁”
  16. Win10 + WSL2 (ubuntu18.04 LTS) + vscode开发环境,win上linux图形化界面劝退实录
  17. 单片机外围电路设计之三:电感
  18. 耶路撒冷圣城起源笔记
  19. warning: implicit declaration of function ‘XXX’; did you mean ‘YYY’? [-Wimplicit-function-declarati
  20. 在计算机中 无符号书最常用于表示,2012年9月计算机等考《一级MS Office》全真模拟试卷(19)...

热门文章

  1. Java网络编程——11.非阻塞I/O
  2. 中国百万美元富翁财富
  3. Init进程和进程 ④
  4. React学习笔记7:React使用注意事项
  5. React学习笔记2:React面向组件编程
  6. Ingress 继任者 Gateway API 使用
  7. 因 Redis Key 命令不规范,导致熬了一个通宵才把Key删完了!
  8. 阿里老员工吐槽:新员工水平差!不服管理!还不加班!我要汇报经理让对方无法转正!...
  9. 几个非常低调的公众号!但副业月入早已过3万...
  10. 设计模式在外卖营销业务中的实践