1. Pytorch中DataSet的使用方法

1.1 DataSet加载数据的方法

  • DataSet是Pytorch中用来表示数据集的一个抽象类,在torch中提供了数据集的基类torch.utils.data.Dataset,继承这个基类,我们能够快速地实现对数据的加载**.**

    __len__:返回数据集大小; __getitem__:可以通过下标方式获取数据

1.2 DataSet类的源码

1.3 DataLoader使用方法

  • 定义dataset实例
  • 设置读取数据batch的大小,常用128,256等等
  • 设置shuffle:bool类型,表示是否在每次获取数据的时候提前打乱数据

1.4 数据集介绍

  • 数据集:setiment.test.data,情感分析二分类数据,数据包含两列,文本和标签.
  • 地址:https://github.com/bojone/bert4keras/tree/master/examples/datasets.
  • 数据集格式如下图所示:

1.5 代码

  • 步骤一:导入工具库
from torch.utils.data import Dataset, DataLoader
import pandas as pd
  • 步骤二:定义数据读取类
class SentimentDataset(Dataset):# 初始化def __init__(self, path_to_file):self.dataset = pd.read_csv(path_to_file, sep="\t", names=["text", "label"])# 返回数据的长度def __len__(self):return len(self.dataset)# 根据编号返回数据def __getitem__(self, idx):text = self.dataset.loc[idx, "text"]    # 文本label = self.dataset.loc[idx, "label"]  # 标签sample = {"text": text, "label": label} # 数据样本return sample
  • 步骤三:定义主函数
if __name__ == "__main__":sentiment_dataset = SentimentDataset("sentiment.test.data")print(sentiment_dataset.__getitem__(0)) # 查看第一条数据
  • 步骤四:使用DataLoader批量读取数据
count = 0
for idx, batch_samples in enumerate(sentiment_dataloader):text_batchs, text_labels = batch_samples["text"], batch_samples["label"]print(idx,text_batchs)count += 1if count == 3:break

十九、Pytorch中的数据加载相关推荐

  1. Pytorch中的数据加载

    Pytorch中的数据加载 1. 模型中使用数据加载器的目的 在前面的线性回归模型中,使用的数据很少,所以直接把全部数据放到模型中去使用. 但是在深度学习中,数据量通常是都非常多,非常大的,如此大量的 ...

  2. pytorch中的数据加载(dataset基类,以及pytorch自带数据集)

    目录 pytorch中的数据加载 模型中使用数据加载器的目的 数据集类 Dataset基类介绍 数据加载案例 数据加载器类 pytorch自带的数据集 torchvision.datasets MIN ...

  3. 【学习系列7】Pytorch中的数据加载

    目录 1. 模型中使用数据加载器的目的 2. 数据集类 3. 迭代数据集 1. 模型中使用数据加载器的目的 在前面的线性回归横型中,我们使用的数据很少,所以直接把全部数据放到锁型中去使用. 但是在深度 ...

  4. c语言文件 加载内存吗,把文件中的数据加载到内存进行查找C语言实现.docx

    把文件中的数据加载到内存进行查找C语言实现 #define _CRT_SECURE_NO_WARNINGS#include#include#includechar **pp=NULL;void ini ...

  5. Spark _25.plus _使用idea读取Hive中的数据加载成DataFrame/DataSet(四)

    对Spark _25 _读取Hive中的数据加载成DataFrame/DataSet(四) https://georgedage.blog.csdn.net/article/details/10309 ...

  6. Spark _25 _读取Hive中的数据加载成DataFrame/DataSet(四)

    由于Hive不在本地,操作略显麻烦.不过细心一点,分析错误,也还好,如果你搭建的hadoop是HA,需要多注意: 这里指出一个错误,如果你报了同类错误,可以参考:https://georgedage. ...

  7. Pytorch CIFAR10图像分类 数据加载与可视化篇

    Pytorch CIFAR10图像分类 数据加载与可视化篇 文章目录 Pytorch CIFAR10图像分类 数据加载与可视化篇 1.数据读取 2. 查看数据(格式,大小,形状) 3. 查看图片 np ...

  8. 第七章:在Spark集群上使用文件中的数据加载成为graph并进行操作(3)

    你可以调整graph的构造参数来指定partition的数量. 当数据加载完毕的时候整个web-Googel.txt就缓存进了内存之中,如下所示: 可以看到数据被缓存成了edges. 下面我们使用把m ...

  9. 浅谈Entity Framework中的数据加载方式

    如果你还没有接触过或者根本不了解什么是Entity Framework,那么请看这里http://www.entityframeworktutorial.net/EntityFramework-Arc ...

最新文章

  1. AddressSanitizer+cmake
  2. linux目录结构简析
  3. 查看mysql表的数据和结构
  4. c ++ stl_获取列表的第一个和最后一个元素| C ++ STL
  5. HTML <input> required 属性
  6. python 数组 元组 列表_python_Day_02[数组、列表、元组之篇]
  7. jsp linux 一键安装包,JspStudy免费版|JspStudy(jsp环境一键安装包) v2016.01.01免费版_星星软件园...
  8. 基于STM32F4实现FOC(磁场定向控制)一:电流采样和波形产生
  9. 计算机利弊英语作文带翻译,电脑的弊英语作文带翻译
  10. 计算机u口保护,U盘写保护怎么办?
  11. HTML5 学习总结(一)——HTML5概要与新增标签
  12. 虚幻4渲染编程(材质编辑器篇)【第六卷:各向异性材质玻璃材质】
  13. 实验一 路由器的基本管理
  14. 广州大学数据库实验三——数据库系统设计综合实验
  15. 属性级情感分析(于restaurant14和laptop14数据集上使用LSTM和GRU、 MemNet和IAN以及CNN等)的对比分析
  16. 如何对PDF文档进行数字签名
  17. (ASCII代码 )密码破译
  18. excel求方差和标准差的函数_Excel标准差_计算函数Stdev和StdevP的使用方法
  19. 在Ubuntu18.04下 安装MPV视频播放器 的方法
  20. nmn修复脑神经是真的吗,nmn到底有没有效,看这一篇就够了

热门文章

  1. file input 点击没反应_动态input file多文件上传到后台没反应的解决方法!!!
  2. python算法与数据结构-循环链表
  3. 轻松搞定python中模板和包的使用
  4. phpstorm+Xdebug断点调试PHP
  5. 全排列的生成算法:字典序法
  6. Linux下 运行Jmeter (含一个jmeter简单示例)
  7. PHP之composer切换国内源
  8. PHP的TRUE|FALSE
  9. 图着色问题贪心算法c语言,区间图着色问题(贪心算法)C++实现
  10. 禁止mysql+root,禁止MySQL root远程访问