目录

1)torchvision.transforms.ToTensor

2)pytorch的图像预处理和caffe中的图像预处理


写这篇文章的初衷,就是同事跑过来问我,pytorch对图像的预处理为什么和caffe的预处理存在差距,我也是第一次注意到这个问题;

1)torchvision.transforms.ToTensor

直接贴代码:

第一段代码:

class ToTensor(object):"""Convert a ``PIL Image`` or ``numpy.ndarray`` to tensor.Converts a PIL Image or numpy.ndarray (H x W x C) in the range[0, 255] to a torch.FloatTensor of shape (C x H x W) in the range [0.0, 1.0]."""def __call__(self, pic):"""Args:pic (PIL Image or numpy.ndarray): Image to be converted to tensor.Returns:Tensor: Converted image."""return F.to_tensor(pic)def __repr__(self):return self.__class__.__name__ + '()'

第二段代码:

def to_tensor(pic):"""Convert a ``PIL Image`` or ``numpy.ndarray`` to tensor.See ``ToTensor`` for more details.Args:pic (PIL Image or numpy.ndarray): Image to be converted to tensor.Returns:Tensor: Converted image."""if not(_is_pil_image(pic) or _is_numpy_image(pic)):raise TypeError('pic should be PIL Image or ndarray. Got {}'.format(type(pic)))if isinstance(pic, np.ndarray):# handle numpy arrayimg = torch.from_numpy(pic.transpose((2, 0, 1)))# backward compatibilityif isinstance(img, torch.ByteTensor):return img.float().div(255)else:return img

在第二段代码中,可以看出图像进来以后,先进行通道转换,然后判断图像类型,若是uint8类型,就除以255;否则返回原图。

在使用opencv读图时,图像读入后的数据类型就是uint8,所以若是自己做实验,想看看transform后的效果,传入随意数据作为图片,记得使用方法如下:

im = np.ones([112, 112, 3])#图像是3*112*112大小,像素值为1,数据类型float64
im = np.array(im, dtype = np.uint8)#将数据float64转换成uint8

2)pytorch的图像预处理和caffe中的图像预处理

在常规使用中,pytorch的图像预处理:

test_transform = transforms.Compose([transforms.ToTensor(),  # range [0, 255] -> [0.0,1.0]transforms.Normalize(mean=(0.5, 0.5, 0.5), std=(0.5, 0.5, 0.5))])  # range [0.0, 1.0] -> [-1.0,1.0]im_tensor = test_transform(im).to(torch.device("cuda:0" if torch.cuda.is_available() else "cpu")).unsqueeze(0)
对应到caffe中的预处理操作:
scale = 0.0078125
mean_value = 127.5tempimg = (tempimg - mean_value) * scale  # done in imResample function wrapped by pythontempimg = tempimg.transpose(0, 3, 1, 2)

参考:

https://pytorch-cn.readthedocs.io/zh/latest/package_references/Tensor/

https://blog.csdn.net/bublebee/article/details/88993467

torchvision.transforms.ToTensor(细节)对应caffe的转换相关推荐

  1. pytorch torchvision.transforms.ToTensor

    API 将Shape=(HWC)的PIL.Image或者numpy.ndarray转换成shape=(CHW)的范围在[0.0,1.0]的torch.FloatTensor 像素值范围从[0, 255 ...

  2. torchvision.transforms.ToTensor的用法

    #torchvision.transforms.ToTensor 对于一个图片img,调用ToTensor转化成张量的形式,发生的不是将图片的RGB三维信道矩阵变成tensor 图片在内存中以byte ...

  3. [Pytorch] torchvision.transforms.ToTensor

    PyTorch框架中有一个非常重要且好用的包:torchvision,该包主要由3个子包组成,分别是:torchvision.datasets.torchvision.models.torchvisi ...

  4. pytorch的图像通道变换,torchvision.transforms.Compose,T.ToTensor

    torchvision.transforms.ToTensor 显示的二值化图片如图所示, 将numpy的图片shape是hwc(高,宽,通道)格式的图片矩阵转换为chw格式的torch.tensor ...

  5. 【小白学PyTorch】7.最新版本torchvision.transforms常用API翻译与讲解

    机器学习炼丹术]的学习笔记分享 <<小白学PyTorch>> 小白学PyTorch | 6 模型的构建访问遍历存储(附代码) 小白学PyTorch | 5 torchvisio ...

  6. torchvision.transforms

    Transform torchvision.transforms中定义了一系列数据转换形式,有PILImage,numpy,Tensor间相互转换,还能对数据进行处理. 在torchvision.da ...

  7. torchvision.transforms 数据预处理:ToTensor()

    文章目录 1.ToTensor() 函数的作用 2.读取图像时 PIL 和 opencv 的选择 2.1 使用 PIL 2.2 使用 opencv 3.ToTensor() 的使用 3.1 关键知识点 ...

  8. transforms.ToTensor()与transforms.Normalize()函数解析

    1.transforms.ToTensor()作用 ToTensor()将shape为(H, W, C)的nump.ndarray或img转为shape为(C, H, W)的tensor,其将每一个数 ...

  9. transforms.Compose,transforms.ToTensor(),transforms.Normalize()的含义与原理

    transforms.Compose,transforms.ToTensor(),transforms.Normalize()的含义与原理 1.问题描述 问题来源于pytorch实现CNN神经网络的示 ...

最新文章

  1. SQL Server 2005数据库日志文件损坏的情况下如何恢复数据库
  2. oc-14-对象方法调用类方法
  3. 反射_Class对象功能_获取Field
  4. C语言深度剖析书籍学习记录 第六章 函数
  5. Linux编译C没有文件名,crt1.o linux x64上没有这样的文件c编译错误
  6. 接收xml参数_SpringBoot实战(二):接收xml请求
  7. x264 x264_slicetype_analyse 函数分析
  8. Xv6 Page Table
  9. 常用的18个免费论文文献网站,分享给大家
  10. pcd格式点云的显示程序
  11. 电驴搜索服务器正在连接,电驴连接不上服务器怎么解决?
  12. DBeaver——设置字体大小
  13. 你知道Linux和Windows通用的复制和粘贴快捷键是什么嘛?
  14. 失物招领小程序_可查询失物、可了解换乘,京港地铁今日上线微信小程序
  15. python精通能赚钱吗_月入3千到月入10万,精通数据分析的人到底有多赚?
  16. 对List集合属性进行模糊查找
  17. 金融(银行)有关业务总结
  18. STM32 烧录程序后上电不工作,但调试模式下可正常工作的解决办法
  19. Lodash的一些基本使用
  20. 2021年十佳优惠券返利APP排名榜 2021年用户喜欢的优惠券返利APP前10排行榜

热门文章

  1. 基因卡方列联表P值检验——相关系数图形
  2. (祈福九寨)网易蜂巢基于容器和微服务加快迭代速度实践
  3. 0.致远OA二次开发课程目录
  4. Qt:ini文件注释语法
  5. ESP32-CAM之ST7789图像显示
  6. 新唐NUC980spi与nor-flash(w25q128)通信配置
  7. 用文件结束符(Ctrl+Z)结束元素输入时不要忘记将流cin恢复为有效状态
  8. com.sun.mail.util.MailConnectException: Couldn't connect to host异常解决
  9. JAVA链表习题---回文结构(详细图解)
  10. 《易经》 就是 那个古代中国的top conference 合集----听了the 7 habits of.....有感