我们发现(通过深度学习框架的高级API能够使实现) (softmax) 线性(回归变得更加容易)。 同样,通过深度学习框架的高级API也能更方便地实现softmax回归模型。 本节如在 :numref:sec_softmax_scratch中一样, 继续使用Fashion-MNIST数据集,并保持批量大小为256。

import torch
from torch import nn
from d2l import torch as d2l
batch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)

初始化模型参数

[softmax回归的输出层是一个全连接层]。 因此,为了实现我们的模型, 我们只需在Sequential中添加一个带有10个输出的全连接层。 同样,在这里Sequential并不是必要的, 但它是实现深度模型的基础。 我们仍然以均值0和标准差0.01随机初始化权重。

# PyTorch不会隐式地调整输入的形状。因此,
# 我们在线性层前定义了展平层(flatten),来调整网络输入的形状
net = nn.Sequential(nn.Flatten(), nn.Linear(784, 10))def init_weights(m):if type(m) == nn.Linear:nn.init.normal_(m.weight, std=0.01)net.apply(init_weights);

重新审视Softmax的实现

我们计算了模型的输出,然后将此输出送入交叉熵损失。 从数学上讲,这是一件完全合理的事情。 然而,从计算角度来看,指数可能会造成数值稳定性问题。

回想一下,softmax函数

softmax回归的简洁实现相关推荐

  1. [pytorch、学习] - 3.7 softmax回归的简洁实现

    参考 3.7. softmax回归的简洁实现 使用pytorch实现softmax import torch from torch import nn from torch.nn import ini ...

  2. softmax回归的简洁实现-09-p5

    softmax回归的简洁实现 通过深度学习框架的高级API能够使实现 softmax 回归变得更加容易 import torch from torch import nn from d2l impor ...

  3. pytorch学习笔记(九):softmax回归的简洁实现

    文章目录 1. 获取和读取数据 2. 定义和初始化模型 3. softmax和交叉熵损失函数 4. 定义优化算法 5. 训练模型 6. 总代码 7.小结 使用Pytorch实现一个softmax回归模 ...

  4. [pytorch、学习] - 3.6 softmax回归的从零开始实现

    参考 3.6 softmax回归的从零开始实现 import torch import torchvision import numpy as np import sys sys.path.appen ...

  5. 【Pytorch神经网络基础理论篇】 08 Softmax 回归 + 损失函数 + 图片分类数据集

    3.4. softmax回归 回归可以用于预测多少的问题. 比如预测房屋被售出价格,或者棒球队可能获得的胜场数,又或者患者住院的天数. 事实上,我们也对分类问题感兴趣:不是问"多少" ...

  6. 李沐笔记(softmax回归)

    回归:估计一个连续值(房价问题) 分类:预测一个离散类别(预测图片中是猫是狗) kaggle上的分类问题:将人类蛋白质显微镜图片分成28类.将恶意软件分成9类.将恶意的Wikipedia评论分成7类. ...

  7. 深度学习基础--SOFTMAX回归(单层神经网络)

    深度学习基础–SOFTMAX回归(单层神经网络) 最近在阅读一本书籍–Dive-into-DL-Pytorch(动手学深度学习),链接:https://github.com/newmonkey/Div ...

  8. 动手学PyTorch | (5) Softmax回归实验

    目录 1. 图像分类数据集(Fashion-Mnist) 2. Softmax回归从0开始实现 3. Softmax回归的简洁实现 1. 图像分类数据集(Fashion-Mnist) 在介绍softm ...

  9. 深度学习PyTorch笔记(12):线性神经网络——softmax回归

    深度学习PyTorch笔记(12):线性神经网络--softmax回归 6 线性神经网络--softmax回归 6.1 softmax回归 6.1.1 概念 6.1.2 softmax运算 6.2 图 ...

最新文章

  1. 云从完成超过18亿元新一轮融资,加快上市步伐
  2. Bzoj2555 SubString
  3. ios中常用数据类型相互转换
  4. 全明星基金季卫东: 重仓新经济冠军,投资“幸福生活“
  5. Linux 下的U盘挂载
  6. mysql版本 hibernate_Mysql 不同版本 说明
  7. xstream中几个注解的含义和用法(转)
  8. Microsoft Blazor——快速开发与SQL Forms开源平台Platz.SqlForms
  9. Docker学习总结(43)——Docker Compose 搭建Mysql主从复制集群
  10. java 8 64位官方下载_Java 8下载 Java 8.0U181官方正式版(32位/64位) 下载-脚本之家
  11. 【信号检测】基于双稳随机共振微弱信号检测含Matlab源码
  12. Android 3D画廊
  13. Twaver-HTML5基础学习(26)背景
  14. 最新爱网外链网盘V5.0版 全新界面 支持图片违规检测
  15. 做外链的六个有效技巧
  16. win10计算机怎么新增用户,win10 如何添加管理员账户_win10 添加管理员账户方法-win7之家...
  17. 常见的HTTP Headers有哪些?
  18. DFS DBS算法
  19. 头歌答案--编写一个能搜索单词的程序Bailey–Borwein–Plouffe公式
  20. Neo4j图数据库,用py2neo中的OGM操作(类似ORM)

热门文章

  1. Postman模拟接口API:接收请求报文equest,响应返回固定报文response
  2. SSE(Server-sent Events)实现Web消息推送(SpringBoot)
  3. 计算机考研调剂专业课,一波七折的计算机考研初试调剂经验教训贴,别放弃,太阳还在...
  4. android高德地图marker图标,高德地图自定义Marker显示文字
  5. Python:OpenCV4识别一个蓝色的圆并估算到相机的距离
  6. windows 命令行查找字符串 和 文件(find findstr for)
  7. opencv 去除背景
  8. 2022-09-06 Android输入法顶起输入框,遮挡RecyclerView
  9. rand和srand的用法
  10. Python练习题——站队顺序输出