COCO数据集是微软发布的一个大型图像数据集, 专为对象检测、分割、人体关键点检测、语义分割和字幕生成而设计。这个数据集还提供了Matlab, Python 和 Lua 的 API 接口. 该 API 接口可以提供完整的图像标签数据的加载, parsing 和可视化。

下面记录一下我是如何利用COCO的数据集来制作目标检测的数据,以及对数据进行增广处理的。

首先我们去COCO的官网http://mscoco.org下载图像数据。之后我们还要下载安装COCO API, https://github.com/Xinering/cocoapi

COCOAPI安装好后,在PythonAPI的目录下,有一个pycocoDemo.ipynb的文件,用Jupyter Notebook运行这个文件,可以看到cocoapi的用法,我根据这个文件的示例来进行改造,把COCO的图像数据和目标检测用到的标注框的数据打包制作为Tensorflow的tfrecord格式的数据,方便之后用Tensorflow来进行训练。代码如下:

#-*- encoding: utf-8 -*-

TFRECORD数据生成后,我们可以进行很多的数据增广(Data augmentation)的处理了。具体的数据增广包括了以下几个方面:

  1. 对图像大小调整到固定的大小(例如416*416),并相应调整Bounding Box的坐标
  2. 把图像大小调整到固定的大小的120%(例如500*500),然后再随机裁剪图片到固定的大小(416*416),并相应调整Bounding Box的坐标
  3. 对图像进行Expand操作,例如随机生成一个是图像1-3倍大小的一个图像(像素值都为0),然后随机放置这个图像进去。然后再把扩展后的图像调整大小到固定的大小(416*416),并相应调整Bounding Box的坐标。相当于缩小Bounding Box
  4. 随机对图像进行Patch的操作,Patch的大小是图像的0.1-1.0,Patch和Bounding Box的IOU值需要在[0.1,0.3,0.5,0.7,0.9]这几个随机值中。相当于对Bounding Box进行扩大
  5. 随机调整图像的颜色,对比度,明亮度,并对图像的数值进行标准化的操作。

具体的代码如下:

import 

运行结果如下:

文章转载自:https://blog.csdn.net/gzroy/article/details/95027532

coco 数据集_Tensorflow对COCO目标检测数据预处理相关推荐

  1. 深度学习目标检测数据VisDrone2019(to yolo / voc / coco)---MMDetection数据篇

    1.VisDrone2019数据集介绍 配备摄像头的无人机(或通用无人机)已被快速部署到广泛的应用领域,包括农业.航空摄影.快速交付和监视.因此,从这些平台上收集的视觉数据的自动理解要求越来越高,这使 ...

  2. [数据集][VOC]高质量的目标检测数据集合集(持续更新)

    [1][数据集名称]数据集VOC正版消防灭火器数据集VOC格式-5156张 [数据集信息]数据集格式:Pascal VOC格式(仅包含jpg图片和对应的xml) 图数量(jpg文件个数 xml文件个数 ...

  3. 如何一个模型走天下?集成训练多数据集,打造通用目标检测模型方法详解

    在目标检测的实际应用中,常常会出现需要泛化的目标检测系统的情况.如城市安防中,需要目标检测系统能够检测足够多类别的目标,才能达到更好的安防效果. 但目前常用的目标检测数据集中包含的类别数量有限,使用单 ...

  4. 90+深度学习开源数据集整理|包括目标检测、工业缺陷、图像分割等多个方向

    导读 本文整理汇总了90+深度学习各方向的开源数据集,包含了小目标检测.目标检测.工业缺陷检测.人脸识别.姿态估计.图像分割.图像识别等方向. 小目标检测 1.AI-TOD航空图像数据集 数据集下载地 ...

  5. pascal行人voc_利用Pascal VOC目标检测数据深度学习进行目标检测

    利用 Pascal VOC 目标检测数据深度学习进行目标检测 穆玉理 [期刊名称] <通讯世界> [年 ( 卷 ), 期] 2018(000)005 [摘要] 随着信息社会的发展 , 尤其 ...

  6. DL之RetinaNet:基于RetinaNet算法(keras框架)利用resnet50_coco数据集(.h5文件)实现目标检测

    DL之RetinaNet:基于RetinaNet算法(keras框架)利用resnet50_coco数据集(.h5文件)实现目标检测 相关文章 DL之RetinaNet:RetinaNet算法的简介( ...

  7. COCO 54.7mAP!DetectoRS目标检测:改进主干网,成就新高度!

    COCO 数据集上的目标检测精度的最高纪录已经有将近一年时间停留在53.3 mAP,曾经报告达到过这一高度的算法有: 1)Cascade Mask R-CNN(Triple-ResNeXt152, m ...

  8. Microsoft COCO: Common Objects in Context - 目标检测评估 指标(Detection Evaluation)

    参考博客 coco官网 coco目标检测评估指标 以下12个指标用于描述COCO上的对象检测器的性能: Average Precision (AP): AP % AP at IoU=.50:.05:. ...

  9. KITTI数据集3D目标检测数据下载并可视化简洁实用版

    KITTI数据集3D目标检测部分下载使用简洁实用版 1.下载数据 使用Left Image和Velodyne点云数据 下载地址:http://www.cvlibs.net/datasets/kitti ...

最新文章

  1. angular 前端路由不生效解决方案
  2. 0基础学python难吗-0基础学武汉Python开发课程有多难?该怎么入门?
  3. Ethernet/IP 学习笔记六
  4. 现在已经不喜欢注释而喜欢直接看代码了
  5. python 字符串变量 组合列表_Python智慧编程——第3讲 字符串与列表
  6. timerpickerview使用_详解iOS App中UIPickerView滚动选择栏的添加方法
  7. MySQL高级 全表扫描更快
  8. 文件夹查找文件(一个文件夹文件查找函数 Delphi)
  9. L1-047 装睡 (10 分)—团体程序设计天梯赛
  10. Nginx源码分析 - 基础数据结构篇 - 缓冲区结构 ngx_buf.c(04)
  11. jQuery插件开发详细教程
  12. [转]前端HTML书写不得不掌握的Emmet缩写语法
  13. Unity 3D下载安装教程
  14. 常见显示器PPI备忘
  15. 【PADS】用PADS画PCB
  16. ruby入门_loop
  17. adb 切换默认桌面_android tv 模拟器默认桌面修改 Alternate Launcher开机自动启动app...
  18. Tecplot 360 安装后弹出“Is your Tecplot 360 EX liense valid?”解决方法
  19. Epub格式电子书格式解析
  20. 对中国国家气象局进行api数据分析

热门文章

  1. TurboMail邮件系统为防垃圾邮件盗号提供专业方案
  2. Linux kill 多余用户终端
  3. 统计整数的各位数字和
  4. java基础知识简化
  5. Flex 加载pdf
  6. 转-TabHost组件(二)(实现底部菜单导航)
  7. jmeter 连接 sqlite 进行压力测试
  8. Linux之tr命令
  9. Hadoop 系列 HDFS:分布式文件系统(HDFS文件读写)
  10. windows 杀 端口