**

PyTorch

**:
是一个开源的Python机器学习库,基于Torch,用于自然语言处理等应用程序。 2017年1月,由Facebook人工智能研究院(FAIR)基于Torch推出了PyTorch。它是一个基于Python的可续计算包,提供两个高级功能:1、具有强大的GPU加速的张量计算(如NumPy)。2、包含自动求导系统的深度神经网络。
PyTorch的前身是Torch,其底层和Torch框架一样,但是使用Python重新写了很多内容,不仅更加灵活,支持动态图,而且提供了Python接口。它是由Torch7团队开发,是一个以Python优先的深度学习框架,不仅能够实现强大的GPU加速,同时还支持动态神经网络。
PyTorch既可以看作加入了GPU支持的numpy,同时也可以看成一个拥有自动求导功能的强大的深度神经网络。除了Facebook外,它已经被Twitter、CMU和Salesforce等机构采用
**

基础环境

**:一台PC设备、一张高性能NVIDIA显卡(可选)、Ubuntu系统。

pytorch与torch的区别、联系


版权声明:上图原文链接:https://blog.csdn.net/WJ_MeiMei/article/details/88720146

**

torchvision

**
torchvision 工具库是 pytorch 框架下常用的图像处理包,可以用来生成图片和视频数据集(torchvision.datasets),做一些图像预处理(torchvision.transforms),导入预训练模型(torchvision.models),以及生成和保存图像(torchvision.utils)。

其中,transforms函数对图像做预处理可以是:归一化(normalize),尺寸剪裁(resize),翻转(flip) 等。

上面的这些步骤实际操作起来往往是一系列的,此时可以用compose将这些图像预处理操作连起来。

很多基于Pytorch的工具集都非常好用,比如处理自然语言的torchtext,处理音频的torchaudio,以及处理图像视频的torchvision。

torchvision包含一些常用的数据集、模型、转换函数等等。当前版本0.5.0包括图片分类、语义切分、目标识别、实例分割、关键点检测、视频分类等工具,它将mask-rcnn功能也都包含在内了。mask-rcnn的Pytorch版本最高支持torchvision 0.2.*,0.3.0之后mask-rcnn就包含到tensorvision之中了。

**

Python图像库PIL的类Image及其方法介绍

**
图像读取通常是RGB,但是图像不一定是RGB格式,这是需要转换。这篇博客介绍非常详细,收藏备用

def convert_PIL_to_numpy(image, format):"""Convert PIL image to numpy array of target format.Args:image (PIL.Image): a PIL imageformat (str): the format of output imageReturns:(np.ndarray): also see `read_image`"""if format is not None:# PIL only supports RGB, so convert to RGB and flip channels over belowconversion_format = formatif format in ["BGR", "YUV-BT.601"]:conversion_format = "RGB"image = image.convert(conversion_format)image = np.asarray(image)# PIL squeezes out the channel dimension for "L", so make it HWCif format == "L":image = np.expand_dims(image, -1)# handle formats not supported by PILelif format == "BGR":# flip channels if neededimage = image[:, :, ::-1]elif format == "YUV-BT.601":image = image / 255.0image = np.dot(image, np.array(_M_RGB2YUV).T)return image
def convert_image_to_rgb(image, format):"""Convert an image from given format to RGB.Args:image (np.ndarray or Tensor): an HWC imageformat (str): the format of input image, also see `read_image`Returns:(np.ndarray): (H,W,3) RGB image in 0-255 range, can be either float or uint8"""if isinstance(image, torch.Tensor):image = image.cpu().numpy()if format == "BGR":image = image[:, :, [2, 1, 0]]elif format == "YUV-BT.601":image = np.dot(image, np.array(_M_YUV2RGB).T)image = image * 255.0else:if format == "L":image = image[:, :, 0]image = image.astype(np.uint8)image = np.asarray(Image.fromarray(image, mode=format).convert("RGB"))return image
def read_image(file_name, format=None):with open(file_name, "rb") as f:image = Image.open(f)return convert_PIL_to_numpy(image, format)

版权声明:本文为CSDN博主「Leemboy」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/leemboy/article/details/83792729


这篇着重讲convert,转换图片格式

版权声明:本文为CSDN博主「icamera0」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/icamera0/article/details/50843172

2021.08.23学习内容Pytorch与Torch的关系以及Torchvision作用相关推荐

  1. 2021.08.25学习内容torch.clamp(input, min, max, out=None) → Tensor,torch.mm(matrix multiply)

    学习pytorch时,看到了mm和clamp,不甚理解,其他地方也看到过,所以具体了解一下 前向传递:计算预测yh = x.mm(w1)h_relu = h.clamp(min=0) 把 h 张量的最 ...

  2. 2021.08.24学习内容torch.utils.data.DataLoader以及CUDA与GPU的关系

    pytorch数据加载: ①totchvision 的包,含有支持加载类似Imagenet,CIFAR10,MNIST 等公共数据集的数据加载模块 torchvision.datasets impor ...

  3. 2021.08.22学习内容torch.cat()和torch.stack()函数

    torch.cat()函数 将两个张量(tensor)拼接在一起,cat是concatnate的意思,即拼接,联系在一起. def cat(tensors: List[torch.Tensor], d ...

  4. 2021.08.26学习内容 Win10+GeForce GTX1650安装NVIDIA显卡驱动及CUDA11.4+cuDNN8.2

    之前主要使用Ubuntu系统,但是个人笔记本更多使用windows,为了方便跑一些pytorch的小代码,所以想在windows配置一下相关环境,达到调用GPU运算的目的. 记录也是为了自己以后有安装 ...

  5. 3.23学习内容,竖立seekbar,sql获取删除重复数据

    竖立的seekbar: http://blog.csdn.net/metalseed/article/details/8014758 原理: 继承AbsSeekBar 通过重写方法旋转: protec ...

  6. 8_用opencv调用深度学习框架tenorflow、Pytorch、Torch、caffe训练好的模型(20190212)

    用opencv调用深度学习框架tenorflow.Pytorch.Torch.caffe训练好模型(20190212) 文章目录: https://blog.csdn.net/hust_bochu_x ...

  7. 2021年软件测试入门到进阶全套学习内容

    前言:本文4004字*(不信你数),包含功能测试体系内全部知识.建议不要在收藏落灰.另外建议不要报名线上功能课程,学费6-7k.还不如在CSDN,学个小班课.因为功能测试偏理论,入门简单. 目录: 什 ...

  8. 大数据周会-本周学习内容总结08

    目录 01[Hadoop] 1.1[MapReduce] 1.2[Yarn] 1.3[让用户自定义脚本在任意地方都可执行-配置方法] 02[下月学习内容] 老师指导 01[Hadoop] 尚硅谷大数据 ...

  9. 深度学习三(PyTorch物体检测实战)

    深度学习三(PyTorch物体检测实战) 文章目录 深度学习三(PyTorch物体检测实战) 1.网络骨架:Backbone 1.1.神经网络基本组成 1.1.1.卷积层 1.1.2.激活函数层 1. ...

最新文章

  1. 如何在maven环境中设置JVM参数
  2. Windows 7 安装 .NET 5 / .NET Core 3.1 环境的方法和依赖文件
  3. 计算机视觉论文doc,嘉炬-计算机视觉论文资料.doc
  4. 关于Servlet和异步Servlet
  5. 有关UIView、subview的几个基础知识点-IOS开发 (实例)
  6. python 爬取网页内容 snmp_python通过SNMP协议收集服务器监控信息
  7. 10突然只剩下c盘和d盘了_科普:为什么软件不能装C盘?会卡!这是真的吗?
  8. 如何在VC环境下使用Halcon库
  9. 力扣题目算法分类【持续更新】
  10. 办公搜索利器UTOOLS-基于EVERYTHING的文件快速搜索软件
  11. OSChina 周四乱弹 ——程序员真正的爱情
  12. 天创速盈电商:拼多多用户群体分析
  13. C语言 - 输入x的值,输出y相应的值 x (x<1) y= 2x-1 (1≤x<10) 3x-11 (x≥10)
  14. 一己之力,不过举鼎,奈何撼天;一世芳华,不余百年,怎易如愿?
  15. 信息化、数字化、数智化
  16. 华为mate40和mate40pro哪个更值得入手-华为mate40和mate40pro的性价比-华为mate40和mate40pro的区别
  17. 常见的HTML标签,让你的网页更加精彩
  18. 九连环 C语言递归代码
  19. Qt编写自定义控件:简单的方式绘制渐变进度条
  20. Android 实现openGL录像添加静态图片水印

热门文章

  1. activeMQ,spring的jmstemplate简单例子
  2. 【技术文档】jeecg3.7.1-maven版本搭建环境手把手入门-eclipse
  3. (新聞) 2008 Altera 亞洲創新大賽 台灣學生成果傲視全球
  4. C#操作DataReader类
  5. Struts2学习(四):Action执行的时候发生了什么
  6. “3遍读书法” 我是这样自学编程的
  7. [译] Grid 布局完全指南
  8. 关于C语言中运算符优先级的一次错误
  9. 【博弈论】【SG函数】bzoj1777 [Usaco2010 Hol]rocks 石头木头
  10. java内部类基础(静态内部类)