方法1、自定义的dataset类

需要实现必要的魔法方法:

  • __init__魔法方法里面进行读取数据文件
  • __getitem__魔法方法进行支持下标访问
  • __len__魔法方法返回自定义数据集的大小,方便后期遍历

面已经定义好了抽象数据,只需给出自己的dataset和idxs(数据的索引列表))

from torch.utils.data import DataLoader, Dataset
class DatasetSplit(Dataset):"""An abstract Dataset class wrapped around Pytorch Dataset class."""def __init__(self, dataset, idxs):self.dataset = datasetself.idxs = [int(i) for i in idxs]def __len__(self):return len(self.idxs)def __getitem__(self, item):image, label = self.dataset[self.idxs[item]]return torch.as_tensor(image), torch.as_tensor(label)
train_loader = DataLoader(DatasetSplit(train_dataset, client_idxs),batch_size=args.local_bs, shuffle=True)

上面的train_dataset是你的数据集,client_idx是你的数据的索引列表,比如[1,2,345,33,54...........],数字代表数据在dataset中的位置。这样制作后的数据集就是client_idx索引的数据集。

方法2:直接使用torch.utils.data.TensorDataset()封装数据集

#划分数据集
import torch
import numpy as np
import torch.utils.data as Data
from sklearn.model_selection import train_test_split
x_train, x_test, y_train,y_test = train_test_split(feature, labels, test_size=0.25)
#制作pytorch识别的数据集
train_dataset = Data.TensorDataset(torch.from_numpy(x_train).float(), torch.from_numpy(y_train))
test_dataset = Data.TensorDataset(torch.from_numpy(x_test).float(), torch.from_numpy(y_test))
#制作可迭代的数据集
train_iter = Data.DataLoader(dataset = train_dataset,batch_size = batch_size,shuffle = True, num_workers = 2)
test_iter = Data.DataLoader(dataset = test_dataset, batch_size= batch_size,shuffle = True, num_workers = 2) 

制作pytorch数据集相关推荐

  1. python制作图片数据集_Pytorch自己加载单通道图片用作数据集训练的实例

    pytorch 在torchvision包里面有很多的的打包好的数据集,例如minist,Imagenet-12,CIFAR10 和CIFAR100.在torchvision的dataset包里面,用 ...

  2. 【深度学习】制作VOC2007数据集用于Faster-RCNN训练

    制作VOC2007数据集用于Faster-RCNN训练:VOC2007格式是faster-RCNN中官方给出的用于训练的数据集,把它下载下来用frcnn/tool里的训练程序跑一跑就可以得到自己的训练 ...

  3. 【深度学习】PyTorch 数据集随机值的完美实践

    作者 | Elvanth@知乎 来源 | https://zhuanlan.zhihu.com/p/377155682 编辑 | 极市平台 本文仅作学术交流,版权归原作者所有,如有侵权请联系删除. 导 ...

  4. [高光谱] Hyperspectral-Classification Pytorch 数据集的读取、划分、加载

    Hyperspectral-Classification Pytorch 数据集的读取.划分.加载 文章目录 Hyperspectral-Classification Pytorch 数据集的读取.划 ...

  5. 利用Arcgis制作图像分割数据集

    利用Arcgis制作图像分割数据集,以制作农村道路标签数据进行二分类为例 一,进行矢量化获取矢量数据 二,制作掩膜 三,mask图像导出 四,原始遥感影像裁剪 五,mask图片和遥感图像裁剪及训练集. ...

  6. (深度学习)构造属于你自己的Pytorch数据集

    (深度学习)构造属于你自己的Pytorch数据集 1.综述 2.实现原理 3.代码细节 4.详细代码 综述 Pytorch可以说是一个非常便利的深度学习库,它甚至在torchvision.datase ...

  7. 使用VIA(VCC)制作coco数据集

    使用VIA(VCC)制作coco数据集 VCC是一个在线的数据集标注工具VCC在线数据集标注地址 进入网址后,删除其中的两张的测试图片 删除测试图片后,点击Add Files添加自己的数据集图片 然后 ...

  8. 使用CycleGAN训练自己制作的数据集,通俗教程,快速上手

    总结了使用CycleGAN训练自己制作的数据集,这里的教程例子主要就是官网给出的斑马变马,马变斑马,两个不同域之间的相互转换.教程中提供了官网给的源码包和我自己调试优化好的源码包,大家根据自己的情况下 ...

  9. 制作视频数据集(一):截取视频帧

    ** 制作视频数据集(一):截取视频帧 ** 1.smart player截取视频帧 直接下载smart player截取即可,我是觉得这个软件截取更简单一些,但我下载之后截取页面显示不了文件,搞不了 ...

最新文章

  1. MySQL数据库环境使用全过程
  2. java数组与对象例题,Java的字符串和数组是以对象的形式出现的。()
  3. 信息系统项目管理师-质量管理知识点
  4. 【Vegas原创】获取远程数据库到本地
  5. 天翼云从业认证课后习题(3.5云安全产品)
  6. http post请求 参数放在路径后面 java_「思唯网络学院」网络基本概念之HTTP协议...
  7. 江苏师范大学科文学院计算机科学与技术,2019江苏师范大学科文学院专业排名...
  8. arm跑操作系统的意义_不太远的猜想:当ARM和鸿蒙OS在笔记本领域相遇,颠覆已无可避免...
  9. linux vi-vim编辑器快捷键
  10. WPF Path.Data 后台代码赋值
  11. 大数据总监python可视化分析30W数据后,找到了抹黑我们的原因
  12. iOS7新特性的兼容性处理方法 之三
  13. 5-2 持久化的作用/5-3 RDB1/5-4 RDB2/5-5 RDB3
  14. 台式计算机鼠标应该插哪里,鼠标插在电脑哪里 鼠标的usb接口没反应如何解决...
  15. 为什么我创建了一个计算机用户名 再打开计算机时 我打不开以前的文件,电脑中office文件无法打开的三种解决方法...
  16. BZOJ2199[Usaco2011 Jan] 奶牛议会
  17. 场景应用:100亿的数据你怎么排序
  18. 简单的个人发展规划java,java个人职业发展方向规划范文
  19. 【PHPWord】PHPWord导出PDF格式文件的几种方式以及最优解并附代码
  20. 热烈祝贺方正璞华两款产品入选2021年度江苏省工业软件优秀产品和应用解决方案拟推广名单

热门文章

  1. Python爬取京东商品
  2. Pycharm解决中文字体大小不一致问题
  3. HDU1862 EXCEL排序
  4. VS code配置c环境
  5. FastDFS设置开机启动
  6. did双重差分法_互助问答第252期:双重差分平行趋势检验等问题
  7. SpringBoot+Vue 完整的外卖系统,手机端和后台管理,可以玩一下!
  8. Android中的Parcelable接口和Serializable用法和区别
  9. Java微信公众号开发面试题
  10. 注册jdbc驱动程序的三种方式