pytroch 数据集 datasets DataLoader示例

# 安装依赖包
! pip install torchvision
Looking in indexes: https://pypi.tuna.tsinghua.edu.cn/simple
Collecting torchvisionDownloading https://pypi.tuna.tsinghua.edu.cn/packages/f0/cb/b484ba727714926cbebe68687960da3481df5619280d17b1d5c90fb610bc/torchvision-0.11.3-cp38-cp38-win_amd64.whl (947 kB)-------------------------------------- 948.0/948.0 KB 1.7 MB/s eta 0:00:00
Requirement already satisfied: numpy in c:\python38\lib\site-packages (from torchvision) (1.20.3)
Requirement already satisfied: torch==1.10.2 in c:\python38\lib\site-packages (from torchvision) (1.10.2)
Requirement already satisfied: pillow!=8.3.0,>=5.3.0 in c:\python38\lib\site-packages (from torchvision) (8.3.2)
Requirement already satisfied: typing-extensions in c:\python38\lib\site-packages (from torch==1.10.2->torchvision) (3.7.4.3)
Installing collected packages: torchvision
Successfully installed torchvision-0.11.3
import torch
from torch.utils.data import Dataset
from torchvision import datasets
from torchvision.transforms import ToTensor
import matplotlib.pyplot as plt
# pytorch自带的datasets类
training_data = datasets.FashionMNIST( # 下载FashionMNIST数据集root="data", # 存储训练/测试数据的路径train=True,  # 指定训练或测试数据集download=True, # 从互联网下载数据transform=ToTensor() # 指定特征和标签转换
)
test_data = datasets.FashionMNIST(root="data",train=False,download=True,transform=ToTensor()
)
labels_map = {  # 标签字典0: "T-Shirt",1: "Trouser",2: "Pullover",3: "Dress",4: "Coat",5: "Sandal",6: "Shirt",7: "Sneaker",8: "Bag",9: "Ankle Boot",
}
figure = plt.figure(figsize=(8, 8))  # 展示窗口大小
cols, rows = 3, 3
for i in range(1, cols * rows + 1):sample_idx = torch.randint(len(training_data), size=(1, )).item()img, label = training_data[sample_idx]figure.add_subplot(rows, cols, i)plt.title(labels_map[label])plt.axis("off")plt.imshow(img.squeeze(), cmap="gray")
plt.show() # 展示图片

# 创建数据集
import os
import pandas as pd
from torchvision.io import read_image# 自定义dataset类
class CustomImageDataset(Dataset):  # 创建数据集类def __init__(self,annotations_file,img_dir,transform=None,  # 转换函数target_transform=None  # 转换函数):self.img_labels = pd.read_csv(annotations_file)  # 标签self.img_dir = img_dir  # 图片文件夹self.transform = transform  # 数据转换self.target_transform = target_transform  # 标签转换def __len__(self):  # 数据集中的样本数return len(self.img_labels)def __getitem__(self, idx):  # 加载并返回给定索引处的数据集中的样本img_path = os.path.join(self.img_dir, self.img_labels.iloc[idx,0])  # 图片路径image = read_image(img_path)  # 读取图片label = self.img_labels.iloc[idx, 1]  # 读取标签if self.transform:image = self.transform(image)if self.target_transform:label = self.target_transform(label)return image, label
from torch.utils.data import DataLoadertrain_dataloader = DataLoader(training_data,  # 数据集batch_size=64,  # 训练批shuffle=True  # 洗牌打乱数据集
)
test_dataloader = DataLoader(test_data, batch_size=64, shuffle=True)
# Display image and label.
train_features, train_labels = next(iter(train_dataloader))
print(f"Feature batch shape: {train_features.size()}")
print(f"Labels batch shape: {train_labels.size()}")
img = train_features[0].squeeze()
label = train_labels[0]
plt.imshow(img, cmap="gray")
plt.show()
print(f"Label: {label}")

pytroch 数据集 datasets DataLoader示例相关推荐

  1. Pytorch教程(十六):FashionMNIST数据集DataSet DataLoader

    torchvision.datasets 由于MNIST数据集太简单,简单的网络就可以达到99%以上的top one准确率,也就是说在这个数据集上表现较好的网络,在别的任务上表现不一定好.因此zala ...

  2. 目标检测系列(preface) 数据集DataSets

    目标检测系列(Preface) - 数据集 公开数据集(PASCAL VOC // COCO)介绍 一.PASCAL VOC格式数据集 官网 标注工具 1.数据集一般格式 VOC2007 Annota ...

  3. 润乾集算报表实现多数据集关联的示例

    多数据源混合的场景在报表开发中非常常见,如:数据来源于多个数据库.数据库和文件混合的场景.传统报表工具在处理这种问题时往往采用两种方式:1将数据统一到一个数据库中,来避免跨库查询或数据库文件混合查询: ...

  4. [Pytorch]将自己的数据集载入dataloader

    一.概述 初始化DataLoader类时必须注入一个参数dataset,而dataset为自己定义.DataSet类可以继承,但是必须重载__len__()和__getitem__ 使用Pytoch封 ...

  5. 文本/文章相似度数据集及使用示例

    目录 1.一些文档相似性的数据集: 2.用于训练文章相似性模型的数据集: 3.要使用ArXiv数据集来训练文章相似性模型,可以遵循以下步骤: 1.一些文档相似性的数据集: Microsoft Rese ...

  6. 【小白学习PyTorch教程】五、在 PyTorch 中使用 Datasets 和 DataLoader 自定义数据

    「@Author:Runsen」 有时候,在处理大数据集时,一次将整个数据加载到内存中变得非常难. 因此,唯一的方法是将数据分批加载到内存中进行处理,这需要编写额外的代码来执行此操作.对此,PyTor ...

  7. Pytroch 深度学习 跑CIFAR10数据集

    CPU跑 from torch.utils.tensorboard import SummaryWriter#from model import *import torchvision from to ...

  8. Pytorch之DataLoader Dataset、datasets、models、transforms的认识和学习

    文章目录 利用PyTorch框架来开发深度学习算法时几个基础的模块 Dataset & DataLoader 基础概念 自定义数据集 1 读取自定义数据集 1 自定义数据集 2 自定义数据集3 ...

  9. sklearn基础篇(一)-- datasets数据集

    sklearn的数据集库datasets提供很多不同的数据集,主要包含以下几大类:         1. 通用数据集         2. 真实世界中的数据集         3. 样本生成器     ...

最新文章

  1. “深度学习之父”大谈AI:寒冬不会出现,论文评审机制有损创新
  2. 该应用程序可能在其主线程上做过多的工作
  3. c++Interpolation search插值搜索的实现算法之二(附完整源码)
  4. webstom设置和monokia配色方案
  5. oracle 全表扫描 分区,oracle分区表全分区扫描问题
  6. mybatis异常invalid comparison: java.util.Date and java.lang.String
  7. 昆仑万维14亿收购音频社交平台Star Group 60%股权 周亚辉获益超10亿元
  8. bootstraptable 怎么在特定行添加数据_同等权限下多任职之间数据权限的实例
  9. INSTALL_FAILED_UID_CHANGED解决办法
  10. python爬取网易云歌词
  11. 大数据技术原理与应用 第三版 林子雨 期末复习(一)大数据概述 第一章 P2
  12. win10设置HTML桌面背景,win10系统分屏设置不同壁纸教程
  13. 小明开了一家糖果店。他别出心裁:把水果糖包成4颗一包和7颗一包的两种。糖果不能拆包卖
  14. “多事之秋”的趣店,如今还好吗?
  15. js实现下雪雪花特效
  16. 作为数字化转型的布道者,疫情后我们还需要坚守什么?
  17. 建立基于IP地址访问的网站
  18. 6.PMAC下位机-下位机编程
  19. CSS translation
  20. Learning From Documents in the Wild to Improve Document Unwarping论文学习笔记

热门文章

  1. 一文了解动态场景中的SLAM的研究现状
  2. 2021-07-27 对labelme标注出来的JSON文件进行灰度图转化(标签值0.1.2.3.4)
  3. docker 数据卷 volume
  4. 怎样写一个增广矩阵到txt文件中
  5. javaScript的运算符和if。。else语句
  6. C库函数-perror()
  7. 代码居中对齐_一篇文章带你了解CSS对齐方式
  8. 【数据结构学习】顺序栈 C语言
  9. 读文献先读图——主成分分析 PCA 图
  10. ISME:南农沈其荣团队基于大数据准确预测土壤的枯萎病发生