1. 数据集简介

Cityscapes数据集,即城市景观数据集,其中包含从50个不同城市的街景中记录的各种立体视频序列,除了更大的20000个弱注释帧之外,还有高质量的5000帧像素级注释。Cityscapes数据集共有fine和coarse两套评测标准,前者提供5000张精细标注的图像,后者提供5000张精细标注外加20000张粗糙标注的图像。train、val、test总共5000张精细释,2975张训练图,500张验证图和1525张测试图,每张图片大小都是1024x2048,官网下载是不包含测试集的标签的,需要在线评估。
Cityscapes数据集旨在用于:

#       name                     id    trainId   category          catId        color
Label(  'unlabeled'            ,  0 ,      255 , 'void'            , 0      (  0,  0,  0) ),
Label(  'ego vehicle'          ,  1 ,      255 , 'void'            , 0      , (  0,  0,  0) ),
Label(  'rectification border' ,  2 ,      255 , 'void'            , 0      , (  0,  0,  0) ),
Label(  'out of roi'           ,  3 ,      255 , 'void'            , 0      , (  0,  0,  0) ),
Label(  'static'               ,  4 ,      255 , 'void'            , 0      , (  0,  0,  0) ),
Label(  'dynamic'              ,  5 ,      255 , 'void'            , 0      , (111, 74,  0) ),
Label(  'ground'               ,  6 ,      255 , 'void'            , 0      , ( 81,  0, 81) ),
Label(  'road'                 ,  7 ,        0 , 'flat'            , 1      , (128, 64,128) ),
Label(  'sidewalk'             ,  8 ,        1 , 'flat'            , 1      , (244, 35,232) ),
Label(  'parking'              ,  9 ,      255 , 'flat'            , 1      , (250,170,160) ),
Label(  'rail track'           , 10 ,      255 , 'flat'            , 1      , (230,150,140) ),
Label(  'building'             , 11 ,        2 , 'construction'    , 2      , ( 70, 70, 70) ),
Label(  'wall'                 , 12 ,        3 , 'construction'    , 2      , (102,102,156) ),
Label(  'fence'                , 13 ,        4 , 'construction'    , 2      , (190,153,153) ),
Label(  'guard rail'           , 14 ,      255 , 'construction'    , 2      , (180,165,180) ),
Label(  'bridge'               , 15 ,      255 , 'construction'    , 2      , (150,100,100) ),
Label(  'tunnel'               , 16 ,      255 , 'construction'    , 2      , (150,120, 90) ),
Label(  'pole'                 , 17 ,        5 , 'object'          , 3      , (153,153,153) ),
Label(  'polegroup'            , 18 ,      255 , 'object'          , 3      , (153,153,153) ),
Label(  'traffic light'        , 19 ,        6 , 'object'          , 3      , (250,170, 30) ),
Label(  'traffic sign'         , 20 ,        7 , 'object'          , 3      , (220,220,  0) ),
Label(  'vegetation'           , 21 ,        8 , 'nature'          , 4      , (107,142, 35) ),
Label(  'terrain'              , 22 ,        9 , 'nature'          , 4      , (152,251,152) ),
Label(  'sky'                  , 23 ,       10 , 'sky'             , 5      , ( 70,130,180) ),
Label(  'person'               , 24 ,       11 , 'human'           , 6      , (220, 20, 60) ),
Label(  'rider'                , 25 ,       12 , 'human'           , 6      , (255,  0,  0) ),
Label(  'car'                  , 26 ,       13 , 'vehicle'         , 7      , (  0,  0,142) ),
Label(  'truck'                , 27 ,       14 , 'vehicle'         , 7      , (  0,  0, 70) ),
Label(  'bus'                  , 28 ,       15 , 'vehicle'         , 7      , (  0, 60,100) ),
Label(  'caravan'              , 29 ,      255 , 'vehicle'         , 7      , (  0,  0, 90) ),
Label(  'trailer'              , 30 ,      255 , 'vehicle'         , 7      , (  0,  0,110) ),
Label(  'train'                , 31 ,       16 , 'vehicle'         , 7      , (  0, 80,100) ),
Label(  'motorcycle'           , 32 ,       17 , 'vehicle'         , 7      , (  0,  0,230) ),
Label(  'bicycle'              , 33 ,       18 , 'vehicle'         , 7      , (119, 11, 32) ),
Label(  'license plate'        , -1 ,       -1 , 'vehicle'         , 7      , (  0,  0,142) ),
category(大类) classes (小类)
flat road、sidewalk、parking、rail track
human person、rider
vehicle car、truck、bus、on rails、motorcycle、bicycle、caravan、trailer
construction building、wall、fence、guard rail、bridge、tunnel
object pole、pole group、traffic sign、traffic light
nature vegetation、 terrain
sky sky
void ground、dynamic、static

2. 数据集下载

分别解压之后包含两个文件夹:

  • gtFine:每张原图对应4个标签文件

    • bochum_xxxxxx_xxxxxx_gtFine_color.png:可视化出来的彩色图像,对应第一部分表格最后一列;

    • bochum_xxxxxx_xxxxxx_gtFine_instanceIds.png:实例分割标签;

    • bochum_xxxxxx_xxxxxx_gtFine_labelIds.png:对应第一部分id列;

    • bochum_xxxxxx_xxxxxx_gtFine_polygons.png:手工标注的第一手数据;

  • leftImg8bit

    • train: 18个城市
    • val: 3个城市
    • test: 6个城市

3. 数据预处理

考虑到原有的1024x2048的图像太大,显存实在是紧张,所以论文里面一般都会对其进行裁剪,我遵循HRNet中的设置,将其处理成512x1024大小的训练图片,为了获得多尺度输入,采用resize和slide window crop两种方式:

import numpy as np
import os
from glob import glob
import cv2def genarate_dataset(data_dir, convert_dict, target_size, save_dir=None, flags=['train', 'val', 'test']):for flag in flags:save_num = 0# 获取待裁剪影像和label的路径images_paths = glob(data_dir + "leftImg8bit/" + flag + "/*/*_leftImg8bit.png")images_paths = sorted(images_paths)gts_paths = glob(data_dir + "gtFine/" + flag + "/*/*gtFine_labelIds.png")gts_paths = sorted(gts_paths)print(len(gts_paths))# 遍历每一张图片for image_path, gt_path in zip(images_paths, gts_paths):# 确保图片和标签对应image_name = os.path.split(image_path)[-1].split('_')[0:3]  # e.g. ['zurich', '000121', '000019']gt_name = os.path.split(gt_path)[-1].split('_')[0:3]assert image_name == gt_name# 读取图片和标签,并转换标签为0-19(20类,0是未分类)image = cv2.imread(image_path)gt = cv2.imread(gt_path, 0)binary_gt = np.zeros_like(gt)# 循环遍历字典的key,并累加value值for key in convert_dict.keys():index = np.where(gt == key)binary_gt[index] = convert_dict[key]# 尺寸target_height, target_width = target_size# ----------------- resize ----------------- ## resize, 参数输入是 宽×高, 不是常用的高×宽(多少行多少列)resize_image = cv2.resize(image, (target_width, target_height), interpolation=cv2.INTER_LINEAR)resize_gt = cv2.resize(binary_gt, (target_width, target_height), interpolation=cv2.INTER_NEAREST)# save_pathimage_save_path = save_dir + flag + "/images/" + str(save_num) + "_resize.png"gt_save_path = save_dir + flag + "/gts/" + str(save_num) + "_resize.png"# savecv2.imwrite(image_save_path, resize_image)cv2.imwrite(gt_save_path, resize_gt)# 每保存一次图片和标签,计数加一save_num += 1# ----------------- slide crop ----------------- #h_arr = [0, 256, 512]w_arr = [0, 512, 1024]# 遍历长宽起始坐标列表,将原始图片随机裁剪为512大小for h in h_arr:for w in w_arr:# cropcrop_image = image[h: h + target_height, w: w + target_width, :]crop_gt = binary_gt[h: h + target_height, w: w + target_width]# save_pathimage_save_path = save_dir + flag + "/images/" + str(save_num) + "_crop.png"gt_save_path = save_dir + flag + "/gts/" + str(save_num) + "_crop.png"# savecv2.imwrite(image_save_path, crop_image)cv2.imwrite(gt_save_path, crop_gt)# 每保存一次图片和标签,计数加一save_num += 1# 依据https://github.com/mcordts/cityscapesScripts/blob/master/cityscapesscripts/helpers/labels.py
# 不同之处在于将trainId里面的255定为第0类,原本的0-18类向顺序后加`1`
pixLabels = { 0:  0,    1:  0,    2:  0,    3:  0,    4:  0,    5:  0,6:  0,    7:  1,    8:  2,    9:  0,   10:  0,   11:  3,12:  4,   13:  5,   14:  0,   15:  0,   16:  0,   17:  6,18:  0,   19:  7,   20:  8,   21:  9,   22: 10,   23: 11,24: 12,   25: 13,   26: 14,   27: 15,   28: 16,   29:  0,30:  0,   31: 17,   32: 18,   33: 19,   -1:  0}genarate_dataset(data_dir='../cityscapes/',convert_dict=pixLabels,target_size=(512, 1024),save_dir='../CityScapesDataset/')

4. 精度指标

Cityscapes评测集给出的四项相关指标IoU class / iIoU class / IoU category / iIou category.

作为IoUclass之外的另外三样指标iIoUclass,IoUcategory,iIoUcategory,其设置的初衷在于对模型整体进行评估的基础上,从不同的角度对模型算法的效果进行探讨,以便进一步优化和改进模型的效果。

  • IoUClass更多考虑的是全局场景的分割结果准确度,其所考量的是整个场景的划分准确度,因此Cityscapes评测集将其默认的优先参照指标。
  • iIoUClass指标则是在IoUClass的基础上,对图像场景进行实例级的分割和结果预测。该指标以场景中的每个实例作为分割对象,类别相同的不同个体实例在该项评估中分别进行评测以得到最终的结果,该指标更加看重算法在各个实例之间的分割准确度。
  • 此外,IoU指标又根据分割的粒度区分为ClassCategory,其中19个细分类别(Class)被划分为7个粗分类别(Category)进行粗粒度的分割,并给出相应的评估指标IoUCategory和iIoUCategory。

CityScapes数据集简介与数据处理和精度指标相关推荐

  1. (二)Cityscapes数据集简介

    欢迎访问个人网络日志

  2. 【GIS风暴】30米分辨率地表覆盖数据GlobeLand30原始数据集简介及下载地址

    数据集预览: GlobeLand30是30米空间分辨率全球地表覆盖数据,目前可供下载使用的有3年的数据:2000-2010-2020,本文主要讲述GlobeLand30的官网下载地址和数据集简介. 数 ...

  3. Dataset之Cityscapes:Cityscapes数据集的简介、安装、使用方法之详细攻略

    Dataset之Cityscapes:Cityscapes数据集的简介.安装.使用方法之详细攻略 目录 Cityscapes数据集的简介 1.Cityscapes数据集的特点 2.Cityscapes ...

  4. cityscapes场景图_Dataset之Cityscapes:Cityscapes数据集的简介、安装、使用方法之详细攻略...

    Dataset之Cityscapes:Cityscapes数据集的简介.安装.使用方法之详细攻略 目录 Cityscapes数据集的简介 1.Cityscapes数据集的特点 2.Cityscapes ...

  5. 语义分割-CityScapes数据集

    前言 常见的语义分割数据集有VOC2012, MS COCO以及Cityscapes等. 今天我们介绍Cityscapes数据集 1. 数据集简介 Cityscapes数据集,即城市景观数据集,其中包 ...

  6. Cityscapes数据集(智能驾驶场景的语义分割)

    前言 面向智能驾驶(辅助驾驶.自动驾驶)场景下的语义分割任务,由于非结构化场景的复杂性,是一个非常具有挑战性的任务,所以有许多研究者和研究机构公开了很多相关的数据集推动语义分割领域的发展.本文主要介绍 ...

  7. 使用cityscapes数据集建立yolov7测试集

    测试集的建立对评价模型好坏非常重要,本文使用cityscapes数据集,对其分割标签进行转换得到目标检测标签,并建立yolov7测试集,对训练的模型进行测试. 标签格式转换主要参考https://bl ...

  8. Flare7K数据集简介与论文阅读

    Flare7K数据集简介与论文阅读 概述 1 简介 2 相关工作 2.1 镜头炫光数据集 2.2 单张图像炫光去除 2.3 夜间去雾和夜间可视性增强 3 夜间镜头炫光的物理学分析 3.1 散射炫光 3 ...

  9. CityScapes数据集转voc数据格式训练yolov5(含下载链接)

    CityScapes数据集转voc数据格式训练yolov5(含下载链接) 1.CityScapes数据集数据格式: 2.数据处理 3.CityScapes数据集转VOC格式转换代码 CityScape ...

最新文章

  1. Revit二次开发之“取得所选元素的族名称”
  2. gitlab 无法git clone 的一个小点
  3. Python模拟浏览器实现网页访问
  4. cdh搭建hadoop集群_Hadoop宿醉:使用Apache Whirr启动hadoop集群CDH4
  5. linux命令 dstat,关于linux:每天学一个-Linux-命令103dstat
  6. [C#反编译教程]001.Reflector.NET反编译工具 v8.5绿色版+注册机+注册教程
  7. 深入理解 Android Activity的生命周期
  8. 学习yaf(二) 使用Bootstrap
  9. 我看了全部文件的字符串资源
  10. JAVASSM框架面试题
  11. android中edittext监听文字变化,使用TextWatcher监听EditText变化
  12. chrome安装crxMouse鼠标右键手势插件后导致需要双击两次才能打开右键菜单
  13. 2018引汉济渭计算机监控系统,基于数字水网的引汉济渭受水区水资源调配业务化研究与应用...
  14. 联想小新Air2020ill版换硬盘及安装Win11详细过程
  15. java logger 乱码_Log4j乱码
  16. post man以Content-type: application/octet-stream方式请求api
  17. python3常用模块_Python学习笔记三(常用模块)
  18. 双边滤波原理(Bilateral Filtering)
  19. 大数据培训 | 电商用户行为分析之订单支付实时监控
  20. 德国意志战胜阿根廷野蛮!德国万岁!

热门文章

  1. 解决 Hadoop 启动 ERROR: Attempting to operate on hdfs namenode as root 的方法
  2. 2021年光明区入驻科技创新产业园科技企业租金补贴申报指南
  3. 大学计算机基础的教案,《大学计算机基础》教案.docx
  4. 穷人快速致富:上班族发财赚钱的10大秘诀
  5. STM32下推式磁悬浮装置(三)PID调试与源码分析
  6. 微信小程序会替代原生APP吗?
  7. 自动网页签到 html,HTML5实现签到 功能
  8. Migrating to the New Material Buttons and their Themes
  9. 语音交互在车载场景中的应用
  10. 方形平板振动克拉尼图形可视化计算MATLAB程序(Chladni Patterns)