1、当数据集是压缩包时,需要解压成图片文件


import zipfile
def unzip_data(src_path,target_path):'''解压原始数据集,将src_path路径下的zip包解压至data/dataset目录下'''if(not os.path.isdir(target_path)):    z = zipfile.ZipFile(src_path, 'r')z.extractall(path=target_path)z.close()else:print("文件已解压")

2、生成json文件

# 说明的json文件信息readjson = {}readjson['all_class_name'] = data_list_path                  #文件父目录readjson['all_class_images'] = all_class_imagesreadjson['class_detail'] = class_detailjsons = json.dumps(readjson, sort_keys=True, indent=4, separators=(',', ': '))with open(train_parameters['readme_path'],'w') as f:f.write(jsons)print ('生成数据列表完成!')

3、自定义data_reader

def data_reader(file_list):'''自定义data_reader'''def reader():with open(file_list, 'r') as f:lines = [line.strip() for line in f]for line in lines:img_path, lab = line.strip().split('\t')img = cv2.imread(img_path)img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)img = np.array(img).astype('float32')img = img/255.0yield img, int(lab) return reader

深度学习制作数据集的部分代码实现(解压zip、生成json文件)相关推荐

  1. java解压zip代码_Java解压zip文件(文本)压缩包

    说明:由于我们的日志收集到指定服务器上,会按天压缩成一个zip格式的压缩包,但是有时候需要对这些日志进行处理,人工解压在处理,显示对于大量的日志处理是不行的(效率太低),所以还是要采用程序自动解压效率 ...

  2. 深度学习制作自己的数据集—为数据集打上标签保存为txt文件,并进行划分和加载数据集

    目录 0 前言 1 为图片数据集打上标签并保存为txt文件 2 将txt文件中的图片标签数据集随机划分为训练集和测试集 3 加载txt文件中的图片标签数据集 0 前言 目前是被封控的第四天了,只能呆在 ...

  3. camvid数据集介绍_深度学习图像数据集介绍(MSCOCO)

    深度学习图像数据集介绍(MSCOCO) MSCOCO数据集是微软开发维护的大型图像数据集,次数聚集的任务包括识别(recognition),分割(segementation),及检测(detectio ...

  4. 深度学习 大数据集处理_大规模深度学习数据集管理系统

    深度学习 大数据集处理 Machine learning is data-driven. Most artificial intelligence (AI) practitioners would a ...

  5. 【三维重建】【深度学习】windows10下NeRF代码Pytorch实现

    [三维重建][深度学习]windows10下NeRF代码Pytorch实现 提示:最近开始在[三维重建]方面进行研究,记录相关知识点,分享学习中遇到的问题已经解决的方法. 文章目录 [三维重建][深度 ...

  6. 快速构建深度学习图像数据集,微软Bing和Google哪个更好用?

    译者 | Serene 编辑 | 明明 出品 | AI 科技大本营(公众号ID:rgznai100) [AI 科技大本营导读]在本文中,作者将利用微软的 Bing Image Search API 来 ...

  7. 25个深度学习开源数据集

    简介 学习深度学习最重要的就是数据集啦.小编在刚开始学习深度学习的时候最头疼的一件事就是没有数据,徒有很多想法,但却无法实现,这里小编给大家介绍25个常用的深度学习开源数据集,这是从国外的一篇博客中看 ...

  8. 深度学习研究生如何快速提升代码能力,写出高效的代码?

    深度学习代码与前端代码区别 深度学习的代码能力与开发后台或者前端的工程代码能力不是一个概念. 写前端代码:脑海中是整个工程的架构,写代码则是把这些架构用 code 具体化. 写深度学习代码:脑海中浮现 ...

  9. 国内外深度学习开放数据集下载集合(值得收藏,不断更新)

    国内外深度学习开放数据集下载集合(值得收藏,不断更新) 一.Image processing data set 1.MNIST ,是最流行的深度学习数据集之一.这是一个手写数字数据集,包含一个有着 6 ...

最新文章

  1. 如何打造一个经常宕机的业务系统?
  2. xshell如何登陆数据库_Xshell连接远程服务器和操作数据库
  3. 《算法设计》二、算法分析基础
  4. 【PD】PowerDesigner生成数据字典
  5. Android事件处理机制
  6. python调用api接口获取数据_python批量爬取NCBI基因注释并调用谷歌API批量翻译
  7. 服务器驱动停止响应,IE驱动程序的命令行服务器已停止工作
  8. oracle基本笔记整理及案例分析2
  9. 使用spyder编译器单步调试python
  10. 温故10个经典排序算法(Java版)
  11. 一年级学python_Python这个黑科技,后悔没有早点学起来
  12. 基于S3C2440A的DM9000A的调试笔记
  13. 从留言板开始做网站(三)——CSS样式代码
  14. 关于安装msi的安装问题:Could not write value to key \ * \ * \ Verify that you have sufficent access to that
  15. web网页前端学习 案例一之制作网页表格
  16. iOS 开发者应该知道的 ARM 结构(转自apple4us)
  17. EVA2.0:大规模中文开放域对话预训练模型
  18. Vue - 本地上传 Excel 文件页面表格预览(配合 ElementUI / 带分页)
  19. java判断数据库是否存在_java判断数据库是否存在的方法
  20. MangoDB安装教程

热门文章

  1. POJ1958 Strange Towers of Hanoi [递推]
  2. Web开发技术大会演讲
  3. 动态规划—最长上升子序列(POJ 1458)
  4. 深层神经网络——总结
  5. 【连载】如何掌握openGauss数据库核心技术?秘诀五:拿捏数据库安全(1)
  6. OGG迁移大库注意要点之impdp导入产生大量归档
  7. 备份恢复:如何让xtrabackup恢复速度提升20倍?
  8. 手把手带你玩转LiteOS Ping组件
  9. 鸿蒙轻内核虚拟内存基础知识:虚拟内存进程空间编号
  10. K近邻算法:机器学习萌新必学算法