数据集的常用格式:h5

  • 深度学习搞了很长时间,其中开源的代码中经常用到大型数据集,里面的数据类型是h5格式,这个格式困扰我挺长时间,因为隔离还拿不到实验室的程序,只好硬着头皮再琢磨一遍。

关于h5文件的基本信息

  • h5这个格式可以把不同模态的数据类型,打包放在一起(有点像压缩),方便传递、下载,可能也方便读取吧,具体它的结构参见其他博客吧,我表述不清楚,其实也没有深入追究,没有必要,只要拿到了里面的内容就可以了;

  • 这个博客写的还行,想知道具体是干嘛的,或者追究h5 的数据结构,可以看看:

https://blog.csdn.net/YYY_77/article/details/118269666

实例

  • 我用的数据集KITTI和NYUDepthV2是两个模态的数据打包在一起的,具体来说:一个深度图,一个RGB图。

  • 最终的代码是这样的:

import h5py
import numpy as npfileName = '00017.h5'
filePath = 'D:\\01-Python_In_One\\PycharmProjects\\mycode\\h5\\'
h5f = h5py.File(filePath + fileName, 'r')print([key for key in h5f.keys()])rgb = np.array(h5f['rgb'])  # 创建以h5中rgb这一group数据为内容的numpy类型array矩阵;
rgb = np.transpose(rgb, (1, 2, 0))
print('np.array type:', type(rgb))
print('np.array dtype:', rgb.dtype)
rgb = np.asfarray(rgb)
print('np.asfarray type:', type(rgb))
print('np.asfarray dtype:', rgb.dtype)

其他参考内容

https://guotong1988.blog.csdn.net/article/details/54093301?spm=1001.2101.3001.6650.1&utm_medium=distribute.pc_relevant.none-task-blog-2defaultCTRLISTRate-1-54093301-blog-103499388.pc_relevant_paycolumn_v3&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2defaultCTRLISTRate-1-54093301-blog-103499388.pc_relevant_paycolumn_v3&utm_relevant_index=2
https://stackoverflow.com/questions/41627147/how-can-i-visualise-an-image-in-h5-format-data?answertab=scoredesc#tab-top
https://blog.csdn.net/rootkiss/article/details/103499388

【h5文件读取】h5文件读取——深度学习数据集常用相关推荐

  1. 深度学习中常用的标注文件

    深度学习中常用的标注文件 mat mat文件是matlab专用的文件,第一次见是再COCOstuff-10k数据集中. 遇到的问题:如果用sublime打开的话,会显示16进制格式,可以猜想matla ...

  2. 深度学习数据集标注工具、图像语料数据库等资源

    NLP+VS︱深度学习数据集标注工具.图像语料数据库.实验室搜索ing... 2017年02月07日 12:12:01 阅读数:27032 ~~因为不太会使用opencv.matlab工具,所以在找一 ...

  3. NLP+VS︱深度学习数据集标注工具、图像语料数据库、实验室搜索ing..

    一.NLP标注工具 来源:<构想:中文文本标注工具(附开源文本标注工具列表)> Chinese-Annotator   来源:https://github.com/crownpku/Chi ...

  4. NLP+VS︱深度学习数据集标注工具、图像语料数据库、实验室搜索ing....

    from: https://blog.csdn.net/sinat_26917383/article/details/54908389 一.NLP标注工具 来源:<构想:中文文本标注工具(附开源 ...

  5. 【图像标注】NLP+VS︱深度学习数据集标注工具、图像语料数据库、实验室搜索ing

    因为不太会使用opencv.matlab工具,所以在找一些比较简单的工具.  .  . 一.NLP标注工具BRAT BRAT是一个基于web的文本标注工具,主要用于对文本的结构化标注,用BRAT生成的 ...

  6. 深度学习数据集定义与加载

    深度学习数据集定义与加载 深度学习模型在训练时需要大量的数据来完成模型调优,这个过程均是数字的计算,无法直接使用原始图片和文本等来完成计算.因此与需要对原始的各种数据文件进行处理,转换成深度学习模型可 ...

  7. 捡漏!用谷歌图片搜索自制深度学习数据集 | 教程

    铜灵 编译整理 量子位 出品 | 公众号 QbitAI 就怕前脚刚立志搞个新研究,后脚就发现没有合适的数据集可用.AI工程师从入门到放弃,可能就是这么一会的功夫. 别找了,现在深度学习数据集也能自制了 ...

  8. 深度学习数据集的准备

    深度学习数据集的准备 下面介绍一个做了很久的项目,其中最简单的一部分是将该乳腺X线数据集进行有病没病的分类训练,说到训练最基本的就是数据集的准备,在这里先讲讲数据集怎么准备.下图是原始数据集的一部分. ...

  9. DL之AF:机器学习/深度学习中常用的激活函数(sigmoid、softmax等)简介、应用、计算图实现、代码实现详细攻略

    DL之AF:机器学习/深度学习中常用的激活函数(sigmoid.softmax等)简介.应用.计算图实现.代码实现详细攻略 目录 激活函数(Activation functions)相关配图 各个激活 ...

最新文章

  1. 【Ghost Blog】如何给Ghost Blog添加背景音乐
  2. 【C++】【四】企业链表
  3. 浅谈设计模式01-策略模式
  4. linux操作命令等积累
  5. LOJ6053简单的函数(min_25筛)
  6. mysqldump备份还原
  7. android 开发对gif解码(适配android 4.2、4.3、4.4版本)
  8. 关于null,undefined,空字符串的判断
  9. 【二进制】Special Numbers
  10. redhat7 配置xmanager登陆
  11. 关于List转Json的简单方法
  12. 黑客帝国_屏幕保护程序
  13. eNSP下的vlan划分实验
  14. 学生HTML个人网页作业作品 基于HTML+CSS+JavaScript明星个人主页(15页)
  15. 数据分析-数据来源、字段类型、数据采集陷阱
  16. 第五章. 可视化数据分析图表—常用图表的绘制2—直方图,饼形图
  17. kali下使用phpstudy
  18. R语言数据可视化包ggplot2之折线图
  19. 韩松EIE:Efficient Inference Engine on Compressed Deep Neural Network论文详解
  20. J2ee学习流程(zz)

热门文章

  1. LR 杂记--nmon 分析 AIX 和 Linux 性能
  2. ruby的require, 和in clude有什么区别
  3. 安装torch-geometric
  4. Paper:人工智能可解释性的背景/方法/伦理/教育/可解释性的基本原理/Interpretability和Explainability区别之《可解释人工智能的教育视角:基于伦理和素养的思考》解读笔记
  5. STM32延时函数的四种方法
  6. 【致远FAQ】V5V8.0sp1_单位管理员-流程督办监控-批量移交-待分配事项,是什么意思?
  7. 计算机的英语怎么拼读,拼音拼读怎么教
  8. 细说 AppbarLayout,如何理解可折叠 Toolbar 的定制
  9. 《大学“电路分析基础”课程实验合集.实验四》丨线性电路特性的研究
  10. 记一次CRM敏捷认证培训学习总结