python读取特殊格式文件

  • 1.pytorch读取lmdb格式文件
  • 参考文献

做深度学习/数据分析,数据读取是基础、必需的一环。特整理,以待后用。

1.pytorch读取lmdb格式文件

内容来源于songlab-cal/tape。

from torch.utils.data import Dataset
from typing import Union, List, Tuple, Sequence, Dict, Any, Optional, Collection
from pathlib import Path
# import torch
import lmdb
import pickle as pkl
import numpy as npclass LMDBDataset(Dataset):"""Creates a dataset from an lmdb file.Args:data_file (Union[str, Path]): Path to lmdb file.in_memory (bool, optional): Whether to load the full dataset into memory.Default: False."""def __init__(self,data_file: Union[str, Path],in_memory: bool = False):data_file = Path(data_file)if not data_file.exists():raise FileNotFoundError(data_file)env = lmdb.open(str(data_file), max_readers=1, readonly=True,lock=False, readahead=False, meminit=False)with env.begin(write=False) as txn:num_examples = pkl.loads(txn.get(b'num_examples'))if in_memory:cache = [None] * num_examplesself._cache = cacheself._env = envself._in_memory = in_memoryself._num_examples = num_examplesdef __len__(self) -> int:return self._num_examplesdef __getitem__(self, index: int):if not 0 <= index < self._num_examples:raise IndexError(index)if self._in_memory and self._cache[index] is not None:item = self._cache[index]else:with self._env.begin(write=False) as txn:item = pkl.loads(txn.get(str(index).encode()))if 'id' not in item:item['id'] = str(index)if self._in_memory:self._cache[index] = itemreturn item

执行下列语句:

lmdb_data = LMDBDataset("../data/fluorescence/fluorescence_train.lmdb")
lmdb_data[0]

参考文献

[1] songlab-cal/tape

python读取特殊格式文件相关推荐

  1. python用os.system打开wav文件_使用python读取wav格式文件

    ** 使用python读取wav格式文件 ** - 基本概念 [采样频率] 即取样频率, 指每秒钟取得声音样本的次数.采样频率越高,声音的质量也就越好,声音的还原也就越真实,但同时它占的资源比较多.由 ...

  2. python获取的html转换为json,python读取XML格式文件并转为json格式

    XML文件如下: 红楼梦书名> 曹雪芹作者> 描述贾宝玉和林黛玉的爱情故事主要内容> 人民文学出版社出版社> 图书> 一.python读取XML格式文件代码: impor ...

  3. python读取各种格式文件方式

    python读取各种格式文件方式 1.读取图片并显示 #方法1 from PIL import Image img=Image.open('1.jpg') img.show() #方法2 import ...

  4. Python——读取raw格式文件

    Python--读取raw格式文件 文章目录 Python--读取raw格式文件 前言 一.直接上代码 前言 简单记录一下python读取raw格式图像,因为reshape来来回回还交换轴搞得人头大, ...

  5. 【自动化测试】Python 读取 .ini 格式文件

    大家应该接触过.ini格式的配置文件.配置文件就是把一些配置相关信息提取出去来进行单独管理,如果以后有变动只需改配置文件,无需修改代码.特别是后续做自动化的测试,需要拎出一部分配置信息,进行管理.比如 ...

  6. python ini文件 遍历_【自动化测试】Python 读取 .ini 格式文件

    大家应该接触过.ini格式的配置文件.配置文件就是把一些配置相关信息提取出去来进行单独管理,如果以后有变动只需改配置文件,无需修改代码.特别是后续做自动化的测试,需要拎出一部分配置信息,进行管理.比如 ...

  7. python读取json格式文件大量数据,以及python字典和列表嵌套用法详解

    1.Python读取JSON报错:JSONDecodeError:Extra data:line 2 column 1 错误原因: JSON数据中数据存在多行,在读取数据时,不能够单单用open(), ...

  8. 怎么样用Python 读取oni 格式文件?

    怎么样用Python 读取oni 文件? 什么是oni 文件? Python读取方法 python 代码示例 什么是oni 文件? oni 文件是openni 的存储文件. Python读取方法 先安 ...

  9. 使用 Python 读取 json 格式文件并查重

    场景如下: 格式为 json 的文件中存在多行测试数据,需要判断文件中 "esbsn" 字段的值是否存在重复数据 {"time":"2022-08-0 ...

最新文章

  1. 在一家开源公司工作的体验!
  2. openpyxl 操作 Excel表的格基本用法
  3. MySQL存储过程_创建-调用
  4. printf语句中包含'\0'字符的处理
  5. Ceph 的用户管理与认证
  6. Linux 初级常用指令
  7. Asp.net中基于Forms验证的角色验证授权[转]
  8. CentOS 5.3 已经发布!
  9. IDL与C#混合编程技术
  10. 视觉SLAM十四讲学习笔记-第七讲-视觉里程计-对极几何和对极约束、本质矩阵、基础矩阵
  11. mysql xmlhttp_php_xmlhttp 乱码问题解决方法
  12. Linkedin领英如何添加或更改账号的邮箱地址的方法和细节,让我们更高效的运用领英
  13. CAM是利用计算机,利用DroidCam将手机摄像头打造成计算机摄像头
  14. 【C#】Message类的属性Msg所关联的消息ID
  15. 袋鼠云数据中台专栏2.0 | 数据中台之数据源
  16. Java学习Day_11
  17. 冰河浅析 - 揭开***的神秘面纱(下)
  18. Eclipse,JKD,JRE
  19. 软件项目质量管理策略
  20. 什么是DDX,DDY,DDZ?

热门文章

  1. curl上传文件的命令
  2. MindManager的优势和特性
  3. Android 基础知识复习
  4. html字体荧光效果,CSS3字体发光效果
  5. 重装系统:全网最详细的重装windows10系统(纯净版)方法:利用微软官方U盘制作工具,制作系统启动U盘并重装系统
  6. r语言用行名称提取数据框信息显示na_R语言-05数据框创建,以及按条件取数据框数据...
  7. eclipse java swt_Eclipse无法加载SWT库
  8. 深度学习基础入门篇[五]:交叉熵损失函数、MSE、CTC损失适用于字识别语音等序列问题、Balanced L1 Loss适用于目标检测
  9. android usb传输图片,关于Android接入USB外接摄像头以及控制拍照并保存图片
  10. Ubuntu 安装 ARP 防火墙