Labelme 批量转 dataset

  • 0.概述
  • 1.原理
  • 2.代码
  • 3.试验过程
    • 3.1 实验一:输入单个目录
    • 3.2 实验二: 增加参数 --out 输出文件目录
  • 4.方法二
    • 4.1 重新创建虚拟环境
    • 4.2 进入虚拟环境和标注目录:
    • 4.3 安装labelme的依赖
    • 4.4 安装labelme
    • 4.5 编写bat文件

实验环境

操作系统:Windows 10
Python:3.8
Labelme:4.5.13 (这个版本比较重要,不同版本代码可能会不一样)
Anaconda:4.10.1

如果还有同学没有安装好 Anaconda,或者 Labelme 请参见,我的另外两篇文章:安装Anaconda,安装 Labelme

0.概述

现有的标注 json 文件转 dataset 的工具只能转单个 json 文件,没有办法批量转多个标注文件。本文中笔者根据转换原理修改相关代码实现了批量转换一个目录下所有 json 文件的方法,该方法支持输入一个目录,并且兼容 -o, --out 参数来指定输出 dataset 的目录,详细介绍如下。

1.原理

默认安装的 Labelme 有个可以单个转换 json 标注文件成 dataset 的工具,在 $python目录\Scripts 下,例如:

Anaconda虚拟环境
D:\anaconda3\envs\labelme\Scripts\labelme_json_to_dataset.exe
非虚拟环境
E:\python\Python37\Scripts\labelme_json_to_dataset.exe

这个exe文件,调用的代码是 $python目录\Lib\site-packages\labelme\cli\json_to_dataset.py ,例如

Anaconda虚拟环境
D:\anaconda3\envs\labelme\Lib\site-packages\labelme\cli\json_to_dataset.py
非虚拟环境
E:\python\Python37\Lib\site-packages\labelme\cli\json_to_dataset.py

执行命令

(labelme) PS D:\anaconda3\envs\labelme\Scripts> .\labelme_json_to_dataset.exe E:\annotation\xx.json --out E:\xxx

1. 参数1:标注文件 xx.json
2. 参数2: --out 输出目录

但是这个只能转单个文件,因此就要修改json_to_dataset.py代码,从转一个文件改成修改多个文件

2.代码

我的这个代码是在Labelme 4.5.13 下修改的,如果同学是这个版本,可以直接使用。如果不是,可以详细看下中文注释,请切记在你自己的文件上修改,要不会出现各种奇怪的问题。
主要思路是在读取完第一个参数后,把参数当成一个目录,读取里面的所有文件,然后循环转换,核心代码如下:

filelist = os.listdir(json_file)  # 输入的参数当成目录,取得目录下的所有 json 文件
for i in range(0, len(filelist)):  # 遍历文件列表path = os.path.join(json_file, filelist[i])  # 单个文件路径if os.path.isdir(path):  # 如果是目录则读取下一个continuemy_out = osp.basename(filelist[i]).replace(".", "_")  # 文件名转目录if args.out is None:# out_dir = osp.basename(json_file).replace(".", "_")  # 注释掉out_dir = osp.join(osp.dirname(json_file), my_out)   # 总目录 + 文件目录else:# out_dir = args.out # 注释掉if not osp.exists(args.out): # 兼容目录不存在情况os.makedirs(args.out)out_dir = osp.join(args.out, my_out)  # 兼容out参数  --  总目录 + 文件目录if not osp.exists(out_dir):os.mkdir(out_dir)

完成代码如下:

import argparse
import base64
import json
import os
import os.path as ospimport imgviz
import PIL.Imagefrom labelme.logger import logger
from labelme import utilsdef main():logger.warning("This script is aimed to demonstrate how to convert the ""JSON file to a single image dataset.")logger.warning("It won't handle multiple JSON files to generate a ""real-use dataset.")parser = argparse.ArgumentParser()parser.add_argument("json_file")parser.add_argument("-o", "--out", default=None)args = parser.parse_args()json_file = args.json_filefilelist = os.listdir(json_file)  # 文件列表for i in range(0, len(filelist)):  # 遍历文件列表path = os.path.join(json_file, filelist[i])  # 文件路径if os.path.isdir(path):  #如果是目录则读取下一个continuemy_out = osp.basename(filelist[i]).replace(".", "_")  # 文件名转目录if args.out is None:# out_dir = osp.basename(json_file).replace(".", "_")  # 注释掉out_dir = osp.join(osp.dirname(json_file), my_out)   # 总目录 + 文件目录else:# out_dir = args.out # 注释掉if not osp.exists(args.out): # 兼容目录不存在情况os.makedirs(args.out)out_dir = osp.join(args.out, my_out)  # 兼容out参数  --  总目录 + 文件目录if not osp.exists(out_dir):os.mkdir(out_dir)data = json.load(open(path))   # 读取目录标注文件imageData = data.get("imageData")if not imageData:imagePath = os.path.join(os.path.dirname(json_file), data["imagePath"])with open(imagePath, "rb") as f:imageData = f.read()imageData = base64.b64encode(imageData).decode("utf-8")img = utils.img_b64_to_arr(imageData)label_name_to_value = {"_background_": 0}for shape in sorted(data["shapes"], key=lambda x: x["label"]):label_name = shape["label"]if label_name in label_name_to_value:label_value = label_name_to_value[label_name]else:label_value = len(label_name_to_value)label_name_to_value[label_name] = label_valuelbl, _ = utils.shapes_to_label(img.shape, data["shapes"], label_name_to_value)label_names = [None] * (max(label_name_to_value.values()) + 1)for name, value in label_name_to_value.items():label_names[value] = namelbl_viz = imgviz.label2rgb(lbl, imgviz.asgray(img), label_names=label_names, loc="rb")PIL.Image.fromarray(img).save(osp.join(out_dir, "img.png"))utils.lblsave(osp.join(out_dir, "label.png"), lbl)PIL.Image.fromarray(lbl_viz).save(osp.join(out_dir, "label_viz.png"))with open(osp.join(out_dir, "label_names.txt"), "w") as f:for lbl_name in label_names:f.write(lbl_name + "\n")logger.info("Saved to: {}".format(out_dir))if __name__ == "__main__":main()

3.试验过程

打开这个,进入conda的命令行:

进入 labelme_json_to_dataset.exe 目录

(base) PS C:\Users\xxx> d:
(base) PS D:\> cd D:\anaconda3\envs\labelme\Scripts\

进入labelme 的虚拟环境

(base) PS D:\anaconda3\envs\labelme\Scripts> conda activate labelme
(labelme) PS D:\anaconda3\envs\labelme\Scripts>

3.1 实验一:输入单个目录

标注文件目录 E:\annotation

执行命令:

(labelme) PS D:\anaconda3\envs\labelme\Scripts> .\labelme_json_to_dataset.exe E:\annotation\


生成的文件:

3.2 实验二: 增加参数 --out 输出文件目录

执行命令:

 (labelme) PS D:\anaconda3\envs\labelme\Scripts> .\labelme_json_to_dataset.exe E:\annotation\ --out E:\xxx


4.方法二

还有网友提出可以通过批处理文件进行批量的转换,我也做了实验,相关脚本和实验过程如下:

4.1 重新创建虚拟环境

创建名叫 labelme2 的虚拟环境

(base) PS C:\Users\xxx> conda create -n labelme2 python=3.8

4.2 进入虚拟环境和标注目录:

(base) PS C:\Users\xxx> conda activate labelme2
(labelme2) PS C:\Users\xxx> e:
(labelme2) PS E:\annotation> cd E:\annotation\

4.3 安装labelme的依赖

conda install pillow
conda install pyqt

4.4 安装labelme

pip install labelme

4.5 编写bat文件

将下列代码保存到txt中,存放到你的json目录下,改后缀为.bat

@echo off
for %%i in (*.json) do D:\anaconda3\envs\labelme2\Scripts\labelme_json_to_dataset "%%i"
pause


执行bat

(labelme2) PS E:\annotation> .\conver.bat

结果如下:


欢迎有问题的小伙伴留言讨论,o( ̄︶ ̄)o

参考:
[1]. 实现labelme批量json_to_dataset方法
[2]. labelme标签批量转换,labelme_json_to_dataset

Labelme 批量转 dataset 使用 labelme_json_to_dataset 命令 (简明图文教程)相关推荐

  1. 批量修改文件名中的一部分,图文教程

    如何批量修改文件名中的一部分?作为一名上班族,每天要处理很多的文件,由于工作的特殊性,有些小伙伴每天需要修改大量的文件名称.假设有几百个文件,这些文件的名称里面都包含一部分相同的错误文字,现在需要将所 ...

  2. 如何批量给照片加水印?详细图文教程

    如何批量给照片加水印?现在每个人都有较强的版权意识,将照片分享到互联网上之前,我们会在照片上添加水印,这已经变成了一个普遍的现象.我们一般会在照片上添加自己的专属logo或者文字水印,这样不但可以防止 ...

  3. 命令行设置dns_dos命令netsh图文教程,设置修改IP地址子网掩码网关命令行改dns...

    大家好,我是老盖,首先感谢观看本文,本篇文章做的有视频,视频讲述的比较详细,也可以看我发布的视频. 今天我们学习dos命令中的netsh,这个命令是网络命令,它有很多的功能,今天我们用它来修改一下本机 ...

  4. bat递归查找指定文件_dos命令find图文教程,查找搜索文件文本字符串,bat批处理脚本...

    大家好,我是老盖,首先感谢观看本文,本篇文章做的有视频,视频讲述的比较详细,也可以看我发布的视频. 今天,我们学习DOS命令中的find这个命令,它这个命令可以查询文件的字符串,也可以查询另外其他命令 ...

  5. bat循环执行带参数_dos命令exit图文教程,结束退出CMD.EXE程序或当前bat批处理脚本...

    大家好,我是老盖,首先感谢观看本文,本篇文章做的有视频,视频讲述的比较详细,也可以看我发布的视频. 今天我们学习dos命令中的exit这个命令,退出 CMD.EXE 程序(命令解释器)或当前批处理脚本 ...

  6. scp命令密码写命令里_dos命令net图文教程,net user添加删除用户修改密码批处理脚本...

    大家好,我是老盖,首先感谢观看本文,本篇文章做的有视频,视频讲述的比较详细,也可以看我发布的视频. 今天我们学习net命令中的user这个命令,输入命令,net user /?,可以看到这个命令的语法 ...

  7. java获取 msinfo32 api_dos命令systeminfo图文教程,显示操作系统配置信息msinfo32

    大家好,我是老盖,首先感谢观看本文,本篇文章做的有视频,视频讲述的比较详细,也可以看我发布的视频. 今天我们学习systeminfo命令,该工具显示本地或远程机器(包括服务包级别)的操作系统配置的信息 ...

  8. Dev-C++ 调试方法简明图文教程

    1. 把"生成调试信息"设置为 Yes.方法如下: Tools(工具) --> Compiler Options(编译器选项) --> Settings(设置) 2. ...

  9. VBA引用PHP开源项目批量生成条形码和二维码图文教程

    http://club.excelhome.net/forum.php?mod=viewthread&tid=1369455

最新文章

  1. 消息队列系列二(IOT中消息队列的应用)
  2. java切面不需要接口了吗_使用java语言,如何对一个类中的静态方法做切面编程?...
  3. Office 2010 系统要求
  4. SpringMVC的上传和下载
  5. JAVA判断数组最大值
  6. ssh连接出现 WARNING: REMOTE HOST IDENTIFICATION HAS CHANGED!
  7. 32位数据源中没有mysql_基于 SpringBoot 多数据源 动态数据源 主从分离 快速启动器...
  8. oracle 数据库文件丢失
  9. java 获取指定日前的前一天
  10. zeppelin k8s安装部署和基本使用教程(在线的分析工具)
  11. Login.jsp登录页面代码(css+bootstrap)
  12. 使用Charles抓取百词斩单词音频、单词翻译、例句音频、例句翻译
  13. (OC) interface
  14. java毕业设计时装购物系统mybatis+源码+调试部署+系统+数据库+lw
  15. python矩阵运算函数_Numpy 常用矩阵计算函数
  16. w ndows无法完成格式化,windows无法完成格式化怎么办【图文教程】
  17. 生成新浪短地址 php,生成新浪的短链接和还原新浪短链接类(方法)总结
  18. html网页的主题标签是什么6,HTML标签及标签属性大全(网页制作必备知识)
  19. 关于『数据结构』:图论
  20. 单片机加减法计算器_单片机加法计算器程序

热门文章

  1. opencv曝光算法_OpenCV特征点提取算法对比
  2. 三层交换机实现VLAN之间通信的实验
  3. [深度学习论文笔记][CVPR 17 oral]A-Fast-RCNN: Hard Positive Generation via Adversary for Object Detection
  4. 蒙版透明,子视图不透明
  5. android 实时虚化,实时虚化如何实现?详解红米Pro双摄原理
  6. JAVA计算机毕业设计茶店订购管理系统Mybatis+源码+数据库+lw文档+系统+调试部署
  7. u盘提示设备不在计算机中,电脑插入U盘时提示设备错误怎么解决
  8. linux体感游戏下载,篮球水上运动手机版下载-篮球水上运动游戏下载v1.1-Linux公社...
  9. 电动汽车的种类有哪些?
  10. Bishop 模式识别与机器学习读书笔记_ch1.3 决策论与信息论基础