pytorch基础教程2
1. 四部曲
1)forward; 2) 计算误差 ;3)backward; 4) 更新
eg:
1)outputs = net(inputs)
2)loss = criterion(outputs, labels)
3)loss.backward()
4)optimizer.step()
其中,每步关键
1)定义网络
2)定义loss: criterion = nn.CrossEntropyLoss()
3)自动求导
4) 定义优化方法: optimizer = torch.optim.SGD(net.parameters(), lr=0.001, momentum=0.9)
由此,麻烦的是1),2)
2.
转载于:https://www.cnblogs.com/Wanggcong/p/7720456.html
pytorch基础教程2相关推荐
- 深度学习之Pytorch基础教程!
↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货 作者:李祖贤,Datawhale高校群成员,深圳大学 随着深度学习的发展 ...
- 【深度学习】深度学习之Pytorch基础教程!
作者:李祖贤,Datawhale高校群成员,深圳大学 随着深度学习的发展,深度学习框架开始大量的出现.尤其是近两年,Google.Facebook.Microsoft等巨头都围绕深度学习重点投资了一系 ...
- Pytorch基础教程(1):人工智能与Pytorch简介
Pytorch基础教程(1) :人工智能与Pytorch简介 1.人工智能简介 人工智能是新一轮科技革命和产业变革的重要驱动力量,其发挥作用的广度和深度堪比历次工业革命.蒸汽革命成就了英国,电气和信息 ...
- PyTorch基础教程学习笔记(八):训练一个分类器
数据应该怎么办呢? 通常来说,当必须处理图像.文本.音频或视频数据时,可以使用python标准库将数据加载到numpy数组里.然后将这个数组转化成torch.*Tensor. 对于图片,有Pillow ...
- 【Pytorch基础教程36】基于Ernie预训练模型和Bert的新闻分类
文章目录 一.新闻分类任务 1.1 中文数据集 1.2 数据特点 1.3 跑起代码 二. 预训练语言模型ERNIE 2.1 ERNIE模型结构 2.2 bert模型结构 三.项目代码 1. bert模 ...
- 【PyTorch基础教程9】优化器optimizer和训练过程
学习总结 (1)每个优化器都是一个类,一定要进行实例化才能使用,比如: class Net(nn.Moddule):··· net = Net() optim = torch.optim.SGD(ne ...
- 【Pytorch基础教程35】引入非线性的激活函数
文章目录 一.从最简单的logistic回归说起 二.为什么需要激活功能 三.常见激活函数特点: 3.1 ReLU激活函数 3.2 sigmoid激活函数 3.3 tanh激活函数 3.4 softm ...
- 【Pytorch基础教程32】基于transformer的情感分类
note: 常用的BERT模型其实就是transformer模型的编码器部分,用户为下游任务生成一段话的文本表示.BERT是一个无监督学习的过程,可通过MLM和NSP两种预训练任务实现无监督训练的过程 ...
- 【Pytorch基础教程28】浅谈torch.nn.embedding
学习总结 文章目录 学习总结 一.nn.Embedding 二.代码栗子 2.1 通过embedding降维 2.2 RNN中用embedding改进 2.3 deepFM模型中embedding R ...
- 【Pytorch基础教程33】算法模型部署(MLFlow/ONNX/tf serving)
内容概况 服务器上训练好模型后,需要将模型部署到线上,接受请求.完成推理并且返回结果. 保存模型结构和参数最简单的是torch.save保存为checkpoint,但一般用于训练时记录过程,训练中断可 ...
最新文章
- 【学习笔记】mysql多实例安装
- Jenkins + Pipeline 构建流水线发布
- Jmeter中JDBC Connection Configuration实现MySQL JDBC Request数据库处理
- unef螺纹_硬料怎么车螺纹?一文了解螺纹的分类及其刀具选择
- 双非硕士阿里大数据开发面经(已拿offer)
- Task 6.2冲刺会议六 /2015-5-19
- Win10电脑如何定时关机
- MySQL 8 中值得关注的新特性和改进
- 自定义Toast的出现样式
- 24 Hour Wallpaper for Mac(动态桌面壁纸软件)
- 使用思科交换机Packet——Tracer模拟器教程
- 网络媒体教程:人物素描
- Android双系统实现
- 三次样条拟合典型实例
- 「米聊」突然复活,雷布斯真的是出其不意
- 数据库安全性和完整性考虑_您是否考虑过云安全性?
- maya blend shape
- java 矩形类的作用_java中关于矩形类
- [IMWeb训练营]-团队作业
- 北京上海地图数据兴趣点poi下载
热门文章
- Fiddler操作技巧
- Notification详解(含工具类)
- 准备系统地学习一下Python
- 【高效程序员系列】1、好马配好鞍——舒适的工作环境
- 从Android发展看Meego
- 修复IPSEC Services服务无法启动的问题
- new操作符内部原理(二) 及 delete和free
- android jni调试打印char阵列
- Cesium 已知两点,计算以一个点为圆心,将另一个点旋转一定度数后的新点的坐标/position_A绕position_B逆时针旋转angle度(角度)得到新点 function rotatedPo
- 用java设计空间管理系统_一套简单通用的Java后台管理系统,拿来即用,非常方便(附项目地址)...