softmax回归的简洁实现
我们发现(通过深度学习框架的高级API能够使实现) (softmax) 线性(回归变得更加容易)。 同样,通过深度学习框架的高级API也能更方便地实现softmax回归模型。 本节如在 :numref:sec_softmax_scratch
中一样, 继续使用Fashion-MNIST数据集,并保持批量大小为256。
import torch
from torch import nn
from d2l import torch as d2l
batch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)
初始化模型参数
[softmax回归的输出层是一个全连接层]。 因此,为了实现我们的模型, 我们只需在Sequential
中添加一个带有10个输出的全连接层。 同样,在这里Sequential
并不是必要的, 但它是实现深度模型的基础。 我们仍然以均值0和标准差0.01随机初始化权重。
# PyTorch不会隐式地调整输入的形状。因此,
# 我们在线性层前定义了展平层(flatten),来调整网络输入的形状
net = nn.Sequential(nn.Flatten(), nn.Linear(784, 10))def init_weights(m):if type(m) == nn.Linear:nn.init.normal_(m.weight, std=0.01)net.apply(init_weights);
重新审视Softmax的实现
我们计算了模型的输出,然后将此输出送入交叉熵损失。 从数学上讲,这是一件完全合理的事情。 然而,从计算角度来看,指数可能会造成数值稳定性问题。
回想一下,softmax函数
softmax回归的简洁实现相关推荐
- [pytorch、学习] - 3.7 softmax回归的简洁实现
参考 3.7. softmax回归的简洁实现 使用pytorch实现softmax import torch from torch import nn from torch.nn import ini ...
- softmax回归的简洁实现-09-p5
softmax回归的简洁实现 通过深度学习框架的高级API能够使实现 softmax 回归变得更加容易 import torch from torch import nn from d2l impor ...
- pytorch学习笔记(九):softmax回归的简洁实现
文章目录 1. 获取和读取数据 2. 定义和初始化模型 3. softmax和交叉熵损失函数 4. 定义优化算法 5. 训练模型 6. 总代码 7.小结 使用Pytorch实现一个softmax回归模 ...
- [pytorch、学习] - 3.6 softmax回归的从零开始实现
参考 3.6 softmax回归的从零开始实现 import torch import torchvision import numpy as np import sys sys.path.appen ...
- 【Pytorch神经网络基础理论篇】 08 Softmax 回归 + 损失函数 + 图片分类数据集
3.4. softmax回归 回归可以用于预测多少的问题. 比如预测房屋被售出价格,或者棒球队可能获得的胜场数,又或者患者住院的天数. 事实上,我们也对分类问题感兴趣:不是问"多少" ...
- 李沐笔记(softmax回归)
回归:估计一个连续值(房价问题) 分类:预测一个离散类别(预测图片中是猫是狗) kaggle上的分类问题:将人类蛋白质显微镜图片分成28类.将恶意软件分成9类.将恶意的Wikipedia评论分成7类. ...
- 深度学习基础--SOFTMAX回归(单层神经网络)
深度学习基础–SOFTMAX回归(单层神经网络) 最近在阅读一本书籍–Dive-into-DL-Pytorch(动手学深度学习),链接:https://github.com/newmonkey/Div ...
- 动手学PyTorch | (5) Softmax回归实验
目录 1. 图像分类数据集(Fashion-Mnist) 2. Softmax回归从0开始实现 3. Softmax回归的简洁实现 1. 图像分类数据集(Fashion-Mnist) 在介绍softm ...
- 深度学习PyTorch笔记(12):线性神经网络——softmax回归
深度学习PyTorch笔记(12):线性神经网络--softmax回归 6 线性神经网络--softmax回归 6.1 softmax回归 6.1.1 概念 6.1.2 softmax运算 6.2 图 ...
最新文章
- 云从完成超过18亿元新一轮融资,加快上市步伐
- Bzoj2555 SubString
- ios中常用数据类型相互转换
- 全明星基金季卫东: 重仓新经济冠军,投资“幸福生活“
- Linux 下的U盘挂载
- mysql版本 hibernate_Mysql 不同版本 说明
- xstream中几个注解的含义和用法(转)
- Microsoft Blazor——快速开发与SQL Forms开源平台Platz.SqlForms
- Docker学习总结(43)——Docker Compose 搭建Mysql主从复制集群
- java 8 64位官方下载_Java 8下载 Java 8.0U181官方正式版(32位/64位) 下载-脚本之家
- 【信号检测】基于双稳随机共振微弱信号检测含Matlab源码
- Android 3D画廊
- Twaver-HTML5基础学习(26)背景
- 最新爱网外链网盘V5.0版 全新界面 支持图片违规检测
- 做外链的六个有效技巧
- win10计算机怎么新增用户,win10 如何添加管理员账户_win10 添加管理员账户方法-win7之家...
- 常见的HTTP Headers有哪些?
- DFS DBS算法
- 头歌答案--编写一个能搜索单词的程序Bailey–Borwein–Plouffe公式
- Neo4j图数据库,用py2neo中的OGM操作(类似ORM)
热门文章
- Postman模拟接口API:接收请求报文equest,响应返回固定报文response
- SSE(Server-sent Events)实现Web消息推送(SpringBoot)
- 计算机考研调剂专业课,一波七折的计算机考研初试调剂经验教训贴,别放弃,太阳还在...
- android高德地图marker图标,高德地图自定义Marker显示文字
- Python:OpenCV4识别一个蓝色的圆并估算到相机的距离
- windows 命令行查找字符串 和 文件(find findstr for)
- opencv 去除背景
- 2022-09-06 Android输入法顶起输入框,遮挡RecyclerView
- rand和srand的用法
- Python练习题——站队顺序输出