「Self-driving: KITTI」KITTI数据集简介
背景
KITTI数据集建立前,前人的实验在米德尔伯里等既定基准上排名靠前的方法在从实验室转移到现实世界时表现低于平均水平。 除了向社区提供具现实世界数据以减少实验偏差,KITTI在补充现有基准的情况下,形成了一个新颖且具有挑战性的计算机视觉基准。
KITTI数据集涵盖的任务包括:立体视觉、光流、视觉里程计量、3D目标检测和3D跟踪。使用的传感器包括:两个高分辨率彩色相机和灰度视频相机、激光雷达、GPS系统。KITTI在中型城市卡尔斯鲁厄、农村地区和高速公路上行驶中收集。 每张图像最多可以看到 15 辆汽车和 30 名行人。
除了提供原始格式的所有数据,KITTI还为每个任务提供了基准。 对于每个基准还提供了一个评估指标和评估网站。
KITTI数据集任务分类
- 立体
- 光流
- 场景流
- 深度
- 里程计量
- 目标检测
- 跟踪
- 道路
- 语义
传感器配置细节
- GPS/IMU: OXTS RT 3003
- Lidar: Velodyne HDL-64E
- 灰度相机(1.4 Megapixels): Point Grey Flea 2 (FL2-14S3M-C)
- 彩色相机(1.4 Megapixels): Point Grey Flea 2 (FL2-14S3C-C)
- 各式镜头(4-8 mm): Edmund Optics NT59-917
其中,激光雷达的频率为10帧/秒,每次循环大约捕捉100k个点,水平像素为64,点云数据格式是在激光雷达坐标系下的(x, y, z, ρ)分别表示点在激光雷达坐标下的坐标(x, y, z)和点的反射强度,;相机安装在与地平面大致水平,使用libdc’s 格式、模式7对相机图像剪裁成1382x512,由于修正的原因使得图像略小;相机快门时间最快2ms,且使用激光雷达触发相机拍摄,因此相机频率与激光雷达频率持平。
整个传感器的部署和各传感器坐标系朝向如下图:
3D目标检测
可用数据
整个3D目标检测基准包括7481张训练图像和7518张测试图像,以及其各自对应的点云数据。这些图像中一共包含了80256个已标注的目标对象。在评估方面,数据集计算的是准确度-召回率的曲线,此外,为了对各个方法进行排名,还计算了平均准确率。
可供下载的数据包括:
- 左方彩色相机图像
- 右方彩色相机图像
- 左方彩色相机3个时间前的帧
- 右方彩色相机3个时间前的帧
- 点云数据
- 对应传感器的相机标定数据
- 数据集的训练标签
- 目标开发工具箱代码(包括3D目标检测和鸟瞰试图评估代码)
- 预训练的LSVM基础模型,网络结构是LSVM-MDPM-sv和LSVM-MDPM-us的网络结构
- 训练和测试的检测对象参考数据
- 将KITTI数据转化成PASCAL VOC格式的代码
- KITTI,KITTI tracking,Pascal VOC,Udacity,CrowAI和AUTTI格式相互转化的代码
评估细节
其中,对3D目标检测性能评估,使用的是PASCAL用于2D目标检测的标准
远距离目标检测结果根据bbox在图像上的高度进行过滤;只要目标出现在图像中并被标注,那么目标在dont car区域不会被标注为假正例。评估方法并不关心图像上没有出现而被忽略掉的检测结果,因为这些检测结果可能提高假正例的数量。
对于汽车的3D检测,要求重叠率超过70%,而对于行人和自行车骑手则指要求bbox重叠超过50%。根据程度划分为三类:
- 简单类:bbox最小高度为40像素,最大重叠范围:完全可见,最大截断比例为15%
- 中等类:bbox最小高度为25像素,最大重叠范围:部分可见,最大截断比例为30%
- 困难类:bbox最小高度为25像素,最大重叠范围:不容察觉,最大截断比例为50%
检测类别
- 汽车
- 行人
- 自行车手
「Self-driving: KITTI」KITTI数据集简介相关推荐
- kitti数据集简介、百度网盘分享 kitti-object、kitti-tracking 全套数据集 自动驾驶
0 写在前面 最近在学习MOT相关知识,之前暑期实习是在一家自动驾驶公司,公司资料里已经有了kitti数据集,所以直接用的,并没有去下载.但是最近自己在学校也用到了这个数据集,所以就去官网下载了,结果 ...
- Kitti数据集简介
Kitti数据集简介 Kitti数据集介绍 Kitti数据集标注格式 Kitti数据集下载地址: http://www.cvlibs.net/datasets/kitti/eval_object.ph ...
- 【KITTI】KITTI数据集简介(三) — 图像数据image_2
KITTI数据集种共包含了4相机数据,2个灰度相机和2个彩色相机,其中image_2存储了左侧彩色相机采集的RGB图像数据(RGB).其他图像数据本次暂时不介绍,后续算法研究如果用到再进行补充. 相机 ...
- 中文语言能力评测基准「智源指数」问世:覆盖17种主流任务,19个代表性数据集,更全面、更均衡...
来源:AI科技评论 作者:琰琰 编辑:青暮 人工智能大模型时代,评测基准成为大模型发展的风向标.从扁平到全面系统,从简化到多重维度,智源指数CUGE旨在尝试为大模型评测设计一张全面评估综合能力的新考卷 ...
- KITTI自动驾驶数据集可视化教程
本文介绍关于自动驾驶数据集KITTI的基本操作,包括Camera和LiDAR可视化教程,源码已上传:https://download.csdn.net/download/cg129054036/209 ...
- 337调查之「普遍排除令」简介及2018年度典型案例探讨
「咦?明明公司产品并没有在美国被告专利侵权,为何因为专利问题在美国海关被挡下来了?」这种看似不可思议的情形.在美国是很可能发生的,尤其是面向一般大众类型的消费性产品.这情况称背后的可能原因是因为该产品 ...
- SLAM数据集TUM,KITTI,EuRoC数据集的下载地址与真实轨迹文件的查找
目录 前言 一.TUM数据集 1.下载地址 2.真实轨迹文件的查找 3.轨迹格式 二.KITTI数据集 1.下载地址 2.真实轨迹文件的查找 三.EuRoC数据集 1.下载地址 2.真实轨迹文件的查找 ...
- 史上最大「面部识别数据研究」:43年,100个数据集,9个可怕的真相
编辑:小匀.LQ 本文转自:新智元 [导读]面部识别技术最初用于刑事调查和监控,受到政府的支持和推广,但现在已经发展成为无所不知的资本主义广告定位机器,最近一项对过去43年面部识别训练数据集的研究,显 ...
- 《预训练周刊》第4期:智源「悟道1.0」发布、GPT-3对新一代APP的赋能路径
No.04 智源社区 预训练组 预 训 练 研究 观点 资源 活动 关于周刊 超大规模预训练模型是当前人工智能领域研究的热点,为了帮助研究与工程人员了解这一领域的进展和资讯,智源社区整理了第4期< ...
最新文章
- 网络:TCP/UDP
- ACM之【文件操作】
- USTC English Club Note20171011
- 递归神经网络部分组件(七)
- Web API 速率限制(一)
- Java架构师必备框架技能核心笔记,附相关架构及资料
- Substitute Algorithm(替换算法)
- imclearboder matlab,Lucas
- 20172318 2018-2019-1 《程序设计与数据结构》第9周学习总结
- 6月第1周安全回顾 Flash Player漏洞危机 邮件泄漏敏感信息
- Yii 一些小的问题
- C# 视频播放控件 wmp、vlc、aplayer
- 扇贝有道180911每日一句
- vue 富文本编辑器 —— wangEditor
- 远程计算机无法操作,win7系统的QQ远程协助无法控制计算机的问题的解决方法
- MySQL数据库简介
- 吴恩达-机器学习-简单决策树
- FPGA组合逻辑训练-三八译码器
- 一个好用的 JSON 编辑器 JsonEditor V1.03.2
- 怎么关闭win7计算机一键还原系统,Win7卸载一键还原功能后还会保留在开机启动菜单中怎么办...
热门文章
- .net ajax 怎么写,.NET学习篇--Ajax中Url的写法
- mysql truncate drop_详解MySQL中DROP,TRUNCATE 和DELETE的区别实现mysql从零开始 | 很文博客...
- 廖雪峰python2.7教程_Python 2.7教程
- VTK:隐式选择循环用法实战
- OpenCASCADE:Inspector简介
- boost::python::iterator相关的测试程序
- boost::multi_array模块测试 storage_order-isms
- boost::iterator_adaptor用法的测试程序
- boost::hana::detail模块实现相关算法的测试程序
- boost::interprocess::offset_ptr用法的测试程序