点击上方，选择星标或置顶，每天给你送干货！

阅读大概需要8分钟

跟随小博主，每天进步一丢丢

来源：知乎

https://zhuanlan.zhihu.com/p/76459295

整理：机器学习算法与自然语言处理

目录：

指定GPU编号
查看模型每层输出详情
梯度裁剪
扩展单张图片维度
one hot编码
防止验证模型时爆显存
学习率衰减
冻结某些层的参数
对不同层使用不同学习率
模型相关操作
Pytorch内置one hot函数

1、指定GPU编号

设置当前使用的GPU设备仅为0号设备，设备名称为 /gpu:0：os.environ["CUDA_VISIBLE_DEVICES"] = "0"
设置当前使用的GPU设备为0,1号两个设备，名称依次为 /gpu:0、/gpu:1：os.environ["CUDA_VISIBLE_DEVICES"] = "0,1" ，根据顺序表示优先使用0号设备,然后使用1号设备。

指定GPU的命令需要放在和神经网络相关的一系列操作的前面。

2、查看模型每层输出详情

Keras有一个简洁的API来查看模型的每一层输出尺寸，这在调试网络时非常有用。现在在PyTorch中也可以实现这个功能。

使用很简单，如下用法：

input_size 是根据你自己的网络模型的输入尺寸进行设置。

pytorch-summargithub.com

3、梯度裁剪（Gradient Clipping）

nn.utils.clip_grad_norm_ 的参数：

parameters – 一个基于变量的迭代器，会进行梯度归一化
max_norm – 梯度的最大范数
norm_type – 规定范数的类型，默认为L2

不椭的椭圆提出：梯度裁剪在某些任务上会额外消耗大量的计算时间，可移步评论区查看详情。

4、扩展单张图片维度

因为在训练时的数据维度一般都是 (batch_size, c, h, w)，而在测试时只输入一张图片，所以需要扩展维度，扩展维度有多个方法：

或

或（感谢coldleaf 的补充）

tensor.unsqueeze(dim)：扩展维度，dim指定扩展哪个维度。

tensor.squeeze(dim)：去除dim指定的且size为1的维度，维度大于1时，squeeze()不起作用，不指定dim时，去除所有size为1的维度。

5、独热编码

在PyTorch中使用交叉熵损失函数的时候会自动把label转化成onehot，所以不用手动转化，而使用MSE需要手动转化成onehot编码。

Convert int into one-hot formatdiscuss.pytorch.org

https://link.zhihu.com/?target=https%3A//discuss.pytorch.org/t/convert-int-into-one-hot-format/507/3

注：第11条有更简单的方法。

6、防止验证模型时爆显存

验证模型时不需要求导，即不需要梯度计算，关闭autograd，可以提高速度，节约内存。如果不关闭可能会爆显存。

with torch.no_grad():# 使用model进行预测的代码pass

感谢zhaz 的提醒，我把 torch.cuda.empty_cache() 的使用原因更新一下。

这是原回答：

Pytorch 训练时无用的临时变量可能会越来越多，导致 out of memory ，可以使用下面语句来清理这些不需要的变量。

官网上的解释为：

Releases all unoccupied cached memory currently held by the caching allocator so that those can be used in other GPU application and visible innvidia-smi. torch.cuda.empty_cache()

意思就是PyTorch的缓存分配器会事先分配一些固定的显存，即使实际上tensors并没有使用完这些显存，这些显存也不能被其他应用使用。这个分配过程由第一次CUDA内存访问触发的。

而 torch.cuda.empty_cache() 的作用就是释放缓存分配器当前持有的且未占用的缓存显存，以便这些显存可以被其他GPU应用程序中使用，并且通过 nvidia-smi命令可见。注意使用此命令不会释放tensors占用的显存。

对于不用的数据变量，Pytorch 可以自动进行回收从而释放相应的显存。

更详细的优化可以查看优化显存使用和显存利用问题。

7、学习率衰减

8、冻结某些层的参数

参考：Pytorch 冻结预训练模型的某一层

在加载预训练模型的时候，我们有时想冻结前面几层，使其参数在训练过程中不发生变化。

我们需要先知道每一层的名字，通过如下代码打印：

假设前几层信息如下：

后面的True表示该层的参数可训练，然后我们定义一个要冻结的层的列表：

冻结方法如下：

冻结后我们再打印每层的信息：

可以看到前两层的weight和bias的requires_grad都为False，表示它们不可训练。

最后在定义优化器时，只对requires_grad为True的层的参数进行更新。

optimizer = optim.Adam(filter(lambda p: p.requires_grad, net.parameters()), lr=0.01)

9、对不同层使用不同学习率

我们对模型的不同层使用不同的学习率。

还是使用这个模型作为例子：

对 convolution1 和 convolution2 设置不同的学习率，首先将它们分开，即放到不同的列表里：

我们将模型划分为两部分，存放到一个列表里，每部分就对应上面的一个字典，在字典里设置不同的学习率。

当这两部分有相同的其他参数时，就将该参数放到列表外面作为全局参数，如上面的“weight_decay”。

也可以在列表外设置一个全局学习率，当各部分字典里设置了局部学习率时，就使用该学习率，否则就使用列表外的全局学习率。

10、模型相关操作

这个内容比较多，我写成了一篇文章。

PyTorch 中模型的使用：

https://zhuanlan.zhihu.com/p/73893187

11、Pytorch内置one_hot函数

感谢 yangyangyang 补充：Pytorch 1.1后，one_hot可以直接用torch.nn.functional.one_hot。

然后我将Pytorch升级到1.2版本，试用了下 one_hot 函数，确实很方便。

具体用法如下：

F.one_hot会自己检测不同类别个数，生成对应独热编码。我们也可以自己指定类别数：

升级 Pytorch (cpu版本)的命令：conda install pytorch torchvision -c pytorch

（希望Pytorch升级不会影响项目代码）

GutHub:

https://link.zhihu.com/?target=https%3A//github.com/zxdefying/pytorch_tricks

方便交流学习，备注：昵称-学校（公司）-方向，进入DL&NLP交流群。

方向有很多：机器学习、深度学习，python，情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

推荐阅读：

【ACL 2019】腾讯AI Lab解读三大前沿方向及20篇入选论文

【一分钟论文】IJCAI2019 | Self-attentive Biafﬁne Dependency Parsing

【一分钟论文】 NAACL2019-使用感知句法词表示的句法增强神经机器翻译

【一分钟论文】Semi-supervised Sequence Learning半监督序列学习

【一分钟论文】Deep Biaffine Attention for Neural Dependency Parsing

详解Transition-based Dependency parser基于转移的依存句法解析器

经验 | 初入NLP领域的一些小建议

学术 | 如何写一篇合格的NLP论文

干货 | 那些高产的学者都是怎样工作的？

一个简单有效的联合模型

近年来NLP在法律领域的相关研究工作

让更多的人知道你“在看”

【PyTorch】推荐收藏！史上最全的 PyTorch trick 集锦相关推荐

python高分书籍推荐_史上最全的Python书排行榜｜你想知道的都在这里
原标题:史上最全的Python书排行榜|你想知道的都在这里感谢关注天善智能,走好数据之路↑↑↑ 欢迎关注天善智能,我们是专注于商业智能BI,大数据,数据分析领域的垂直社区,学习,问答.求职一站式搞定 ...
新手必备 | 史上最全的PyTorch学习资源汇总
目录: PyTorch学习教程.手册 PyTorch视频教程 PyTorch项目资源 - NLP&PyTorch实战 - CV&PyTorch实战 PyTorch论 ...
java byte 判断相等_转发收藏 | 史上最全Java面试题+面试网站推荐！（含答案）
今天要谈的主题是关于求职,求职是在每个技术人员的生涯中都要经历多次.对于我们大部分人而言,在进入自己心仪的公司之前少不了准备工作,有一份全面细致面试题将帮助我们减少许多麻烦. 相关概念面向对象的三个 ...
2021年平面设计师、游戏建模师电脑配置推荐，史上最全的配置单
一.是的,作为设计师的你,需要关心硬件. 设计师小伙伴们,不知道你们有没有这样的问题:当你想组装一台机器,询问电脑硬件经销商:"请问我用C4D软件,OC渲染器,想配个渲染快的电脑,有什么推荐 ...
首席架构师推荐：史上最全微服务架构简史详解！
本文将介绍微服务架构和相关的组件,介绍他们是什么以及为什么要使用微服务架构和这些组件.本文侧重于简明地表达微服务架构的全局图景,因此不会涉及具体如何使用组件等细节. 要理解微服务,首先要先理解不是微服 ...
设计师、游戏建模师电脑配置推荐，史上最全的配置单
一.是的,作为设计师的你,需要关心硬件. 设计师小伙伴们,不知道你们有没有这样的问题:当你想组装一台机器,询问电脑硬件经销商:"请问我用C4D软件,OC渲染器,想配个渲染快的电脑,有什么推荐 ...
2020年游戏建模师，设计师的电脑配置推荐，史上最全的配置单
一.是的,作为设计师的你,需要关心硬件. 设计师小伙伴们,不知道你们有没有这样的问题:当你想组装一台机器,询问电脑硬件经销商:"请问我用C4D软件,OC渲染器,想配个渲染快的电脑,有什么推荐 ...
广成子：值得收藏-史上最全Linux ps命令详解
From 闻茂泉(广成)AliDataOps 一.程序员的疑惑大概在十多年前,我当时还是一个产品经理.由于一些工作的原因,需要向运维工程师学习一些linux常用命令.当使用linux ps这个十 ...
收藏 | 史上最全的“大数据”学习资源
2019独角兽企业重金招聘Python工程师标准>>> 当前,整个互联网正在从IT时代向DT时代演进,大数据技术也正在助力企业和公众敲开DT世界大门.当今"大数据" ...
W ndows10如何清理使用痕迹,Win10 C盘突然爆满，怎么清理？史上较全的C盘清理方案，推荐收藏...
原标题:Win10 C盘突然爆满,怎么清理?史上较全的C盘清理方案,推荐收藏有用户和老毛桃说,C盘就像是一个无底洞,无论给它分多大的分区,Windows总有办法给它填满!除了这位用户,相信很多朋友也 ...

【PyTorch】推荐收藏！史上最全的 PyTorch trick 集锦