2012年ACCV《Model Based Training, Detection and Pose Estimation of Texture-Less 3D Objects in Heavily Cluttered Scenes 》公布了一个数据库,该数据库可用于Pose tracking方面的测试。这篇博客主要介绍一下这个数据库,以及使用该数据库时的注意事项。

数据库下载地址:http://campar.in.tum.de/Main/StefanHinterstoisser

该数据库包含了15个texture-less不同物体的RGB图像、每幅图像的深度信息以及对应的3D Ground truth姿态,每个物体超过1000幅图像。打开每个物体的压缩包,我们会发现以下文件:

[1] 文件夹data  该文件夹包含物体的RGB-D图像,深度数据(如depth0.dpt),平移姿态参数(如tra0.tra),旋转姿态参数(如rot0.rot) 4种类型的数据;

[2] mesh.ply  该文件存储的物体的3D模型,可以通过Blender软件打开,关于3D模型.ply文件的格式可以参考以下链接http://zh.wikipedia.org/wiki/PLY;

[3] object.xyz 该文件内存储的物体的3D点云,是一个比较粗糙的3D模型;

[4] Oldmesh.ply  该文件内也是保存的物体的3D模型,该文件与mesh.ply有些不同,其3D点的坐标以及法向量是对应摄像机坐标系的,而mesh.ply是对应世界坐标系(物体坐标系)的。

我们在使用这个数据库时,应该注意以下几点:

1. Ground truth pose parameters 是对应mesh.ply文件中的3D模型的,而不是Oldmesh.ply的;当然,也对应object.xyz内的3D点云。

在使用Ground truth pose parameters时,应该注意的是,平移姿态参数的单位,文件中tra*.tra的数值单位是cm,而mesh.ply中点的坐标单位是mm,因此,应该首先将平移姿态参数数值乘以10(cm->mm)。旋转矩阵没有单位,所以不用考虑。以ape数据第一帧投影为例,投影之后的结果:

2. 深度数据文件depth*.dpt,作者提供了读这种文件的函数,函数中没有使用opencv较新的版本,可以考虑将IplImage类改成Mat类,链接http://campar.in.tum.de/personal/hinterst/index/downloads!09384230443!/loadDepth.txt。文件中的数据单位为mm,可以统一缩放至[0,255],便于可视化。

3. 经过实验发现,mesh.ply+GT pose,投影之后得到的物体轮廓并不完全与物体重合,有较小的偏差,这是由于作者在标Ground Truth时采用的KinectFusion方法,该方法计算姿态参数存在不精确性。

4. 作者提供的txt文件中明确指出,RGB图像与深度数据已经配准了,不需要再进行此操作。

RGB-D dataset相关推荐

  1. vscode配置记录

    vscode配置记录 按照官网教程安装好vs:实际上只需要配置launch.json的"program"如下所示 "configurations": [{&qu ...

  2. 迁移性好、多用途,港中文提出特征分离的无监督人类三维姿态表征​

    来源 | 我爱计算机视觉(ID:aicvml) 本文将介绍一种基于特征分离的通用人类姿态特征的学习算法 Unsupervised Human 3D Pose Representation with V ...

  3. 【转】【C#】使用fo-dicom完成BMP,JPG,PNG图片转换为DICOM文件

    转自:https://developer.aliyun.com/article/672065 最近研究了一下DICOM和BMP文件转换的问题,也是很头大.度娘了很久,也在CSDN等论坛看到一些断断续续 ...

  4. 迁移性好、多用途,港中文提出特征分离的无监督人类三维姿态表征

    本文将介绍一种基于特征分离的通用人类姿态特征的学习算法 Unsupervised Human 3D Pose Representation with Viewpoint and Pose Disent ...

  5. c#如何wmf图片转换成png图片_【C#】使用fo-dicom完成BMP,JPG,PNG图片转换为DICOM文件-阿里云开发者社区...

    最近研究了一下DICOM和BMP文件转换的问题,也是很头大.度娘了很久,也在CSDN等论坛看到一些断断续续的文件,最主要的是代码只是片断,不是完整的实现.头大了. 首先,了解一下BMP文件格式,BMP ...

  6. 第05章 深度卷积神经网络模型

    序言 1. 内容介绍   本章介绍深度学习算法-卷积神经网络用于 图片分类 的应用,主要介绍主流深度卷积神经网络 (CNN) 模型,包括 ResNet DenseNet SeNet 的算法模型.数学推 ...

  7. 关于NTU-RGB+D数据集skeleton数据

    关于NTU-RGB+D数据集skeleton数据 本人最近在做相关的研究,分享一下关于此数据集的经验. 这个数据集是来源于南洋理工大学的ROSE实验室,16年出了60种动作,后来又新增了60种,成为N ...

  8. 读取NTU-RGB-D数据集并利用关节信息生成gif

    一.读取NTU-RGB-D数据集 本文基于matlab2016实现.并需要先下载NTU-RGB-D数据集,打开下载的压缩包得到的是一组后缀名为skeleton 的文件,如图1.1所示 图1.1  NT ...

  9. 计算机视觉数据集大全 - Part2

    转载自http://homepages.inf.ed.ac.uk/rbf/CVonline/Imagedbase.htm Index by Topic Action Databases Agricul ...

  10. 【论文翻译】An Attention Enhanced Graph Convolutional LSTM Network for Skeleton-Based Action Recognition

    An Attention Enhanced Graph Convolutional LSTM Network for Skeleton-Based Action Recognition 基于骨架的注意 ...

最新文章

  1. SQLSERVER2012里的扩展事件初尝试(上)
  2. 微信公众号基本信息配置
  3. Matlab调用Java类访问数据库
  4. 《Linux Shell脚本攻略》读书笔记第五章 一网情深
  5. Entity Framework 4 in Action读书笔记——第三章:查询对象模型基础(1)
  6. python检验阿姆斯特朗数_python 之九九乘法表,润年,奇偶数,阿姆斯特朗数判断分享...
  7. 【hdoj_2152】Fruit(母函数)
  8. 【OS学习笔记】一 处理器、内存和指令
  9. 2017.12.26
  10. 全世界20座最有创意的桥,7座在中国,5座在荷兰!
  11. oracle database 11g plsql 程序设计,oracle-database-11g-plsql-编程实战笔记
  12. 论文笔记 - 《ImageNet Classification with Deep Convolutional Neural Networks》 精典
  13. idea 配置java版本号_IDEA-Maven项目的jdk版本设置方法
  14. 一分钟了解阿里云产品:企业级分布式应用服务EDAS五大热点技术问题分析
  15. Element Form表单布局(一行多列)
  16. (翻译)UIP Application Block学习系列(三)UIP概念
  17. 媲美Teamviewer的远程桌面软件推荐 总有一款适合你
  18. 树莓派3连接ps4无线手柄
  19. 分类模型的评价指标--混淆矩阵,ROC曲线,AUC及sklearn.metrics.roc_curve参数说明
  20. python中bytearray函数_Python bytearray() 函数

热门文章

  1. 快速锁屏电脑快捷键_电脑小技巧
  2. python print(f)执行将报错_Linux中为什么执行自己的程序要在前面加./
  3. pythonfor循环输入_Python之for循环的使用
  4. 河北省国家电网计算机专业,河北省国家电网计算机类题目库.doc
  5. python例题代码_python26个练习题及代码-789
  6. flowgraph java_如何在TensorFlow import_graph_def期间更改输入的维度
  7. mysql 1524_MySQL不允许用户登录:错误1524
  8. iis php的mime类型,IIS MIME类型介绍、MIME大全
  9. Map封装 (一个键多个值)
  10. ECSHOP中transport.js和jquery的冲突的简单解决办法