十九、Pytorch中的数据加载
1. Pytorch中DataSet的使用方法
1.1 DataSet加载数据的方法
DataSet是Pytorch中用来表示数据集的一个抽象类,在torch中提供了数据集的基类torch.utils.data.Dataset,继承这个基类,我们能够快速地实现对数据的加载**.**
__len__
:返回数据集大小;__getitem__
:可以通过下标方式获取数据
1.2 DataSet类的源码
1.3 DataLoader使用方法
- 定义dataset实例
- 设置读取数据batch的大小,常用128,256等等
- 设置shuffle:bool类型,表示是否在每次获取数据的时候提前打乱数据
1.4 数据集介绍
- 数据集:setiment.test.data,情感分析二分类数据,数据包含两列,文本和标签.
- 地址:https://github.com/bojone/bert4keras/tree/master/examples/datasets.
- 数据集格式如下图所示:
1.5 代码
- 步骤一:导入工具库
from torch.utils.data import Dataset, DataLoader
import pandas as pd
- 步骤二:定义数据读取类
class SentimentDataset(Dataset):# 初始化def __init__(self, path_to_file):self.dataset = pd.read_csv(path_to_file, sep="\t", names=["text", "label"])# 返回数据的长度def __len__(self):return len(self.dataset)# 根据编号返回数据def __getitem__(self, idx):text = self.dataset.loc[idx, "text"] # 文本label = self.dataset.loc[idx, "label"] # 标签sample = {"text": text, "label": label} # 数据样本return sample
- 步骤三:定义主函数
if __name__ == "__main__":sentiment_dataset = SentimentDataset("sentiment.test.data")print(sentiment_dataset.__getitem__(0)) # 查看第一条数据
- 步骤四:使用DataLoader批量读取数据
count = 0
for idx, batch_samples in enumerate(sentiment_dataloader):text_batchs, text_labels = batch_samples["text"], batch_samples["label"]print(idx,text_batchs)count += 1if count == 3:break
十九、Pytorch中的数据加载相关推荐
- Pytorch中的数据加载
Pytorch中的数据加载 1. 模型中使用数据加载器的目的 在前面的线性回归模型中,使用的数据很少,所以直接把全部数据放到模型中去使用. 但是在深度学习中,数据量通常是都非常多,非常大的,如此大量的 ...
- pytorch中的数据加载(dataset基类,以及pytorch自带数据集)
目录 pytorch中的数据加载 模型中使用数据加载器的目的 数据集类 Dataset基类介绍 数据加载案例 数据加载器类 pytorch自带的数据集 torchvision.datasets MIN ...
- 【学习系列7】Pytorch中的数据加载
目录 1. 模型中使用数据加载器的目的 2. 数据集类 3. 迭代数据集 1. 模型中使用数据加载器的目的 在前面的线性回归横型中,我们使用的数据很少,所以直接把全部数据放到锁型中去使用. 但是在深度 ...
- c语言文件 加载内存吗,把文件中的数据加载到内存进行查找C语言实现.docx
把文件中的数据加载到内存进行查找C语言实现 #define _CRT_SECURE_NO_WARNINGS#include#include#includechar **pp=NULL;void ini ...
- Spark _25.plus _使用idea读取Hive中的数据加载成DataFrame/DataSet(四)
对Spark _25 _读取Hive中的数据加载成DataFrame/DataSet(四) https://georgedage.blog.csdn.net/article/details/10309 ...
- Spark _25 _读取Hive中的数据加载成DataFrame/DataSet(四)
由于Hive不在本地,操作略显麻烦.不过细心一点,分析错误,也还好,如果你搭建的hadoop是HA,需要多注意: 这里指出一个错误,如果你报了同类错误,可以参考:https://georgedage. ...
- Pytorch CIFAR10图像分类 数据加载与可视化篇
Pytorch CIFAR10图像分类 数据加载与可视化篇 文章目录 Pytorch CIFAR10图像分类 数据加载与可视化篇 1.数据读取 2. 查看数据(格式,大小,形状) 3. 查看图片 np ...
- 第七章:在Spark集群上使用文件中的数据加载成为graph并进行操作(3)
你可以调整graph的构造参数来指定partition的数量. 当数据加载完毕的时候整个web-Googel.txt就缓存进了内存之中,如下所示: 可以看到数据被缓存成了edges. 下面我们使用把m ...
- 浅谈Entity Framework中的数据加载方式
如果你还没有接触过或者根本不了解什么是Entity Framework,那么请看这里http://www.entityframeworktutorial.net/EntityFramework-Arc ...
最新文章
- AddressSanitizer+cmake
- linux目录结构简析
- 查看mysql表的数据和结构
- c ++ stl_获取列表的第一个和最后一个元素| C ++ STL
- HTML <input> required 属性
- python 数组 元组 列表_python_Day_02[数组、列表、元组之篇]
- jsp linux 一键安装包,JspStudy免费版|JspStudy(jsp环境一键安装包) v2016.01.01免费版_星星软件园...
- 基于STM32F4实现FOC(磁场定向控制)一:电流采样和波形产生
- 计算机利弊英语作文带翻译,电脑的弊英语作文带翻译
- 计算机u口保护,U盘写保护怎么办?
- HTML5 学习总结(一)——HTML5概要与新增标签
- 虚幻4渲染编程(材质编辑器篇)【第六卷:各向异性材质玻璃材质】
- 实验一 路由器的基本管理
- 广州大学数据库实验三——数据库系统设计综合实验
- 属性级情感分析(于restaurant14和laptop14数据集上使用LSTM和GRU、 MemNet和IAN以及CNN等)的对比分析
- 如何对PDF文档进行数字签名
- (ASCII代码 )密码破译
- excel求方差和标准差的函数_Excel标准差_计算函数Stdev和StdevP的使用方法
- 在Ubuntu18.04下 安装MPV视频播放器 的方法
- nmn修复脑神经是真的吗,nmn到底有没有效,看这一篇就够了
热门文章
- file input 点击没反应_动态input file多文件上传到后台没反应的解决方法!!!
- python算法与数据结构-循环链表
- 轻松搞定python中模板和包的使用
- phpstorm+Xdebug断点调试PHP
- 全排列的生成算法:字典序法
- Linux下 运行Jmeter (含一个jmeter简单示例)
- PHP之composer切换国内源
- PHP的TRUE|FALSE
- 图着色问题贪心算法c语言,区间图着色问题(贪心算法)C++实现
- 禁止mysql+root,禁止MySQL root远程访问