【h5文件读取】h5文件读取——深度学习数据集常用
数据集的常用格式:h5
- 深度学习搞了很长时间,其中开源的代码中经常用到大型数据集,里面的数据类型是h5格式,这个格式困扰我挺长时间,因为隔离还拿不到实验室的程序,只好硬着头皮再琢磨一遍。
关于h5文件的基本信息
h5这个格式可以把不同模态的数据类型,打包放在一起(有点像压缩),方便传递、下载,可能也方便读取吧,具体它的结构参见其他博客吧,我表述不清楚,其实也没有深入追究,没有必要,只要拿到了里面的内容就可以了;
这个博客写的还行,想知道具体是干嘛的,或者追究h5 的数据结构,可以看看:
https://blog.csdn.net/YYY_77/article/details/118269666
实例
我用的数据集KITTI和NYUDepthV2是两个模态的数据打包在一起的,具体来说:一个深度图,一个RGB图。
最终的代码是这样的:
import h5py
import numpy as npfileName = '00017.h5'
filePath = 'D:\\01-Python_In_One\\PycharmProjects\\mycode\\h5\\'
h5f = h5py.File(filePath + fileName, 'r')print([key for key in h5f.keys()])rgb = np.array(h5f['rgb']) # 创建以h5中rgb这一group数据为内容的numpy类型array矩阵;
rgb = np.transpose(rgb, (1, 2, 0))
print('np.array type:', type(rgb))
print('np.array dtype:', rgb.dtype)
rgb = np.asfarray(rgb)
print('np.asfarray type:', type(rgb))
print('np.asfarray dtype:', rgb.dtype)
其他参考内容
https://guotong1988.blog.csdn.net/article/details/54093301?spm=1001.2101.3001.6650.1&utm_medium=distribute.pc_relevant.none-task-blog-2defaultCTRLISTRate-1-54093301-blog-103499388.pc_relevant_paycolumn_v3&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2defaultCTRLISTRate-1-54093301-blog-103499388.pc_relevant_paycolumn_v3&utm_relevant_index=2
https://stackoverflow.com/questions/41627147/how-can-i-visualise-an-image-in-h5-format-data?answertab=scoredesc#tab-top
https://blog.csdn.net/rootkiss/article/details/103499388
【h5文件读取】h5文件读取——深度学习数据集常用相关推荐
- 深度学习中常用的标注文件
深度学习中常用的标注文件 mat mat文件是matlab专用的文件,第一次见是再COCOstuff-10k数据集中. 遇到的问题:如果用sublime打开的话,会显示16进制格式,可以猜想matla ...
- 深度学习数据集标注工具、图像语料数据库等资源
NLP+VS︱深度学习数据集标注工具.图像语料数据库.实验室搜索ing... 2017年02月07日 12:12:01 阅读数:27032 ~~因为不太会使用opencv.matlab工具,所以在找一 ...
- NLP+VS︱深度学习数据集标注工具、图像语料数据库、实验室搜索ing..
一.NLP标注工具 来源:<构想:中文文本标注工具(附开源文本标注工具列表)> Chinese-Annotator 来源:https://github.com/crownpku/Chi ...
- NLP+VS︱深度学习数据集标注工具、图像语料数据库、实验室搜索ing....
from: https://blog.csdn.net/sinat_26917383/article/details/54908389 一.NLP标注工具 来源:<构想:中文文本标注工具(附开源 ...
- 【图像标注】NLP+VS︱深度学习数据集标注工具、图像语料数据库、实验室搜索ing
因为不太会使用opencv.matlab工具,所以在找一些比较简单的工具. . . 一.NLP标注工具BRAT BRAT是一个基于web的文本标注工具,主要用于对文本的结构化标注,用BRAT生成的 ...
- 深度学习数据集定义与加载
深度学习数据集定义与加载 深度学习模型在训练时需要大量的数据来完成模型调优,这个过程均是数字的计算,无法直接使用原始图片和文本等来完成计算.因此与需要对原始的各种数据文件进行处理,转换成深度学习模型可 ...
- 捡漏!用谷歌图片搜索自制深度学习数据集 | 教程
铜灵 编译整理 量子位 出品 | 公众号 QbitAI 就怕前脚刚立志搞个新研究,后脚就发现没有合适的数据集可用.AI工程师从入门到放弃,可能就是这么一会的功夫. 别找了,现在深度学习数据集也能自制了 ...
- 深度学习数据集的准备
深度学习数据集的准备 下面介绍一个做了很久的项目,其中最简单的一部分是将该乳腺X线数据集进行有病没病的分类训练,说到训练最基本的就是数据集的准备,在这里先讲讲数据集怎么准备.下图是原始数据集的一部分. ...
- DL之AF:机器学习/深度学习中常用的激活函数(sigmoid、softmax等)简介、应用、计算图实现、代码实现详细攻略
DL之AF:机器学习/深度学习中常用的激活函数(sigmoid.softmax等)简介.应用.计算图实现.代码实现详细攻略 目录 激活函数(Activation functions)相关配图 各个激活 ...
最新文章
- 【Ghost Blog】如何给Ghost Blog添加背景音乐
- 【C++】【四】企业链表
- 浅谈设计模式01-策略模式
- linux操作命令等积累
- LOJ6053简单的函数(min_25筛)
- mysqldump备份还原
- android 开发对gif解码(适配android 4.2、4.3、4.4版本)
- 关于null,undefined,空字符串的判断
- 【二进制】Special Numbers
- redhat7 配置xmanager登陆
- 关于List转Json的简单方法
- 黑客帝国_屏幕保护程序
- eNSP下的vlan划分实验
- 学生HTML个人网页作业作品 基于HTML+CSS+JavaScript明星个人主页(15页)
- 数据分析-数据来源、字段类型、数据采集陷阱
- 第五章. 可视化数据分析图表—常用图表的绘制2—直方图,饼形图
- kali下使用phpstudy
- R语言数据可视化包ggplot2之折线图
- 韩松EIE:Efficient Inference Engine on Compressed Deep Neural Network论文详解
- J2ee学习流程(zz)
热门文章
- LR 杂记--nmon 分析 AIX 和 Linux 性能
- ruby的require, 和in clude有什么区别
- 安装torch-geometric
- Paper:人工智能可解释性的背景/方法/伦理/教育/可解释性的基本原理/Interpretability和Explainability区别之《可解释人工智能的教育视角:基于伦理和素养的思考》解读笔记
- STM32延时函数的四种方法
- 【致远FAQ】V5V8.0sp1_单位管理员-流程督办监控-批量移交-待分配事项,是什么意思?
- 计算机的英语怎么拼读,拼音拼读怎么教
- 细说 AppbarLayout,如何理解可折叠 Toolbar 的定制
- 《大学“电路分析基础”课程实验合集.实验四》丨线性电路特性的研究
- 记一次CRM敏捷认证培训学习总结