前言

数据是深度学习的核心，大部分论文里都会提到data-driven这个词，也就是数据驱动的意思。基本的模型搭建完成后，如何处理数据，如何将数据送给网络，如何做数据增强等等，对于提高网络的性能都十分重要，本篇文章会简单讲述下数据处理过程，后续有时间会持续更新这方面的内容，互相学习，共勉！

数据集的均值和标准差

def compute_mean_and_std(dataset):    # 输入为PyTorch的dataset，即数据集，输出为对应数据集均值和标准差        # 均值    mean_r = 0    mean_g = 0    mean_b = 0    for img, _ in dataset:        img = np.asarray(img) # 将 PIL Image 改变成numpy的数组类型        mean_b += np.mean(img[:, :, 0])        mean_g += np.mean(img[:, :, 1])        mean_r += np.mean(img[:, :, 2])    mean_b /= len(dataset)    mean_g /= len(dataset)    mean_r /= len(dataset)    diff_r = 0    diff_g = 0    diff_b = 0    N = 0    for img, _ in dataset:        img = np.asarray(img)        diff_b += np.sum(np.power(img[:, :, 0] - mean_b, 2))        diff_g += np.sum(np.power(img[:, :, 1] - mean_g, 2))        diff_r += np.sum(np.power(img[:, :, 2] - mean_r, 2))        N += np.prod(img[:, :, 0].shape)    std_b = np.sqrt(diff_b / N)    std_g = np.sqrt(diff_g / N)    std_r = np.sqrt(diff_r / N)    mean = (mean_b.item() / 255.0, mean_g.item() / 255.0, mean_r.item() / 255.0)    std = (std_b.item() / 255.0, std_g.item() / 255.0, std_r.item() / 255.0)   return mean, std

常用训练和验证数据预处理

ToTensor 会将 PIL.Image 或形状为 H×W×D，数值范围为 [0, 255] 的numpy数组转换为形状为 D×H×W，数值范围为 [0.0, 1.0] 的 torch.Tensor。

train_transform = torchvision.transforms.Compose([    torchvision.transforms.RandomResizedCrop(size=224, scale=(0.08, 1.0)),    torchvision.transforms.RandomHorizontalFlip(),    torchvision.transforms.ToTensor(),    torchvision.transforms.Normalize(mean=(0.485, 0.456, 0.406)std=(0.229, 0.224, 0.225)), ]) val_transform = torchvision.transforms.Compose([    torchvision.transforms.Resize(256),    torchvision.transforms.CenterCrop(224),    torchvision.transforms.ToTensor(),    torchvision.transforms.Normalize(mean=(0.485, 0.456, 0.406),                                     std=(0.229, 0.224, 0.225)),])

视频数据

import cv2video = cv2.VideoCapture(mp4_path)height = int(video.get(cv2.CAP_PROP_FRAME_HEIGHT))width = int(video.get(cv2.CAP_PROP_FRAME_WIDTH))num_frames = int(video.get(cv2.CAP_PROP_FRAME_COUNT))fps = int(video.get(cv2.CAP_PROP_FPS))video.release()

未完待续，持续更新！

数据增强 transform_深度学习-Pytorch框架学习之数据处理篇相关推荐

PyTorch框架学习八——PyTorch数据读取机制（简述）
PyTorch框架学习八--PyTorch数据读取机制(简述) 一.数据二.DataLoader与Dataset 1.torch.utils.data.DataLoader 2.torch.util ...
深度学习Pytorch框架
深度学习Pytorch框架文章目录深度学习Pytorch框架前言 1. Pytorch命令之``nn.Sequential`` 2. Pytorch命令之``nn.Conv2d`` 3. Pyt ...
基于岭回归的数据增强与深度学习模型
作者:禅与计算机程序设计艺术 <基于岭回归的数据增强与深度学习模型>技术博客文章 <基于岭回归的数据增强与深度学习模型> 引言随着深度学习技术的快速发展,模型压缩.数据增强成 ...
PyTorch框架学习十九——模型加载与保存
PyTorch框架学习十九--模型加载与保存一.序列化与反序列化二.PyTorch中的序列化与反序列化 1.torch.save 2.torch.load 三.模型的保存 1.方法一:保存整个Mo ...
PyTorch框架学习十七——Batch Normalization
PyTorch框架学习十七--Batch Normalization 一.BN的概念二.Internal Covariate Shift(ICS) 三.BN的一个应用案例四.PyTorch中BN的 ...
PyTorch框架学习十二——损失函数
PyTorch框架学习十二--损失函数一.损失函数的作用二.18种常见损失函数简述 1.L1Loss(MAE) 2.MSELoss 3.SmoothL1Loss 4.交叉熵CrossEntropy ...
PyTorch框架学习十——基础网络层（卷积、转置卷积、池化、反池化、线性、激活函数）
PyTorch框架学习十--基础网络层(卷积.转置卷积.池化.反池化.线性.激活函数) 一.卷积层二.转置卷积层三.池化层 1.最大池化nn.MaxPool2d 2.平均池化nn.AvgPool2 ...
PyTorch框架学习五——图像预处理transforms（一）
PyTorch框架学习五--图像预处理transforms(一) 一.transforms运行机制二.transforms的具体方法 1.裁剪 (1)随机裁剪:transforms.RandomCr ...
PyTorch框架学习一——PyTorch的安装（CPU版本）
PyTorch框架学习一--PyTorch的安装(CPU版本) PyTorch简介 PyTorch的安装(CPU版) 机器学习/深度学习领域的学习都是需要理论和实践相结合的,而它们的实践都需要借助于一 ...

数据增强 transform_深度学习-Pytorch框架学习之数据处理篇

前言

数据集的均值和标准差

常用训练和验证数据预处理

视频数据

数据增强 transform_深度学习-Pytorch框架学习之数据处理篇相关推荐

最新文章

热门文章