正如您所料,通过依赖高级 API,我们可以更简洁地实现 MLP。

import torch
from torch import nn
from d2l import torch as d2l

4.3.1 模型

与我们简洁的 softmax 回归实现(第 3.7 节)相比,唯一的区别是我们添加了两个全连接层(之前,我们添加了一个)。第一个是我们的隐藏层,它包含 256 个隐藏单元并应用 ReLU 激活函数。第二个是我们的输出层。

net = nn.Sequential(nn.Flatten(),nn.Linear(784, 256),nn.ReLU(),nn.Linear(256, 10))def init_weights(m):if type(m) == nn.Linear:nn.init.normal_(m.weight, std=0.01)net.apply(init_weights);

训练循环与我们实现 softmax 回归时完全相同。这种模块化使我们能够将有关模型架构的问题与正交考虑分开。

batch_size, lr, num_epochs = 256, 0.1, 10
loss = nn.CrossEntropyLoss(reduction='none')
trainer = torch.optim.SGD(net.parameters(), lr=lr)train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, trainer)

4.3.2. 概括

  • 使用高级 API,我们可以更简洁地实现 MLP。

  • 对于相同的分类问题,MLP 的实现与 softmax 回归的实现相同,只是增加了带有激活函数的隐藏层。

4.3.3. 练习

    1. 尝试添加不同数量的隐藏层(您也可以修改学习率)。什么设置效果最好?
    1. 尝试不同的激活函数。哪一个效果最好?
    1. 尝试不同的方案来初始化权重。什么方法效果最好?

参考

https://d2l.ai/chapter_multilayer-perceptrons/mlp-concise.html

翻译: 4.3. 多层感知器的简明实现MLP pytorch相关推荐

  1. 翻译: 4.多层感知器 pytorch

    在本章中,我们将介绍您的第一个真正深入的网络.最简单的深度网络称为多层感知器,它们由多层神经元组成,每一层都与下层(它们接收输入)和上层(它们反过来影响)中的神经元完全连接.当我们训练高容量模型时,我 ...

  2. 逻辑斯第回归、softmax分类与多层感知器

    本专栏将推出一系列深度学习与图像处理相关的教程文章.注重原理精讲和代码实现.实现框架将重点选择Tensorflow或Pytorch.本讲从逻辑斯第回归入手,然后讲解softmax分类器,最后讲解多层感 ...

  3. 深度学习(一)多层感知器MLP/人工神经网络ANN

    目录 一.定义和公式 1. 多层感知器 Multi Layer Perceptron MLP 2. MLP实现非线性分类 3. Keras介绍 二. 代码实战 1. 建立MLP模型实现二分类 1.1  ...

  4. OpenCV 神经网络 - 多层感知器(MLP)

    一.简述 人工神经网络(ANN) 简称神经网络(NN),能模拟生物神经系统对物体所作出的交互反应,是由具有适应性的简单单元(称为神经元)组成的广泛并行互连网络. 二.M-P神经元 "M-P神 ...

  5. 使用多层感知器进行图片分类

    文章目录 实验目标 实验要求 实验原理 实验步骤 实验分析 源代码 实验目标 多层感知器(Multi-Layer Perceptron,MLP)也叫人工神经网络(Artificial Neural N ...

  6. tensorflow实例-多层感知器

    一.概念 感知器:   上图就是基本的处理元素,它具有输入.输出,每个输入关联一个连接权重,然后输出是输入的加权和. 上图就是一个单层的感知器,输入分别是X0.X1.X2,输出Y是输入的加权和: Y ...

  7. 多层感知器神经网络模型,人工智能神经网络模型

    有哪些深度神经网络模型? 目前经常使用的深度神经网络模型主要有卷积神经网络(CNN).递归神经网络(RNN).深信度网络(DBN).深度自动编码器(AutoEncoder)和生成对抗网络(GAN)等. ...

  8. PyTorch 03—逻辑回归与多层感知器

    什么是逻辑回归 线性回归预测的是一个连续值,逻辑回归给出的"是"和"否"的回答.逻辑回归用到了一个sigmoid函数,将一个连续的变量映射到概率空间(0~1). ...

  9. Chemistry.AI | 基于非线性激活的多层感知器预测分子特性

    Chemistry.AI | 基于线性回归预测分子特性 环境准备 Python版本:Python 3.6.8 PyTorch版本:PyTorch1.1.0 RDKit版本:RDKit 2019.09. ...

  10. 【深度学习】多层感知器高级使用

    [深度学习]多层感知器高级使用 文章目录 1 JSON序列化模型 2 YAML格式 3 模型增量更新 4 神网检查点 5 导入模型 6 可视化训练过程 神经网络的变种目前有很多,如误差反向传播(Bac ...

最新文章

  1. 词云图可视化python_python 可视化 词云图
  2. 微信支付退款回调处理 php
  3. Linux服务器---安装bind
  4. .NET Core 3.0之深入源码理解Kestrel的集成与应用(一)
  5. python 线程池_老程序员的经验分享:Python 从业十年是种什么体验?
  6. 文本分类(一)封装分词器
  7. SQL server 2008配置与用户名登录
  8. 如何在Mac OSX上装妥node-camera
  9. 自学移动端(APP)自动化测试
  10. Adobe 字体显示不清楚----解决方案
  11. SpringBoot31 整合SpringJDBC、整合MyBatis、利用AOP实现多数据源
  12. 进阶版--Mongodb命令汇总
  13. SAP High Avaliability offering
  14. 使用nw.js将网址打包生成exe可安装程序支持xp系统
  15. 第十三章:项目相关方管理 - (13.1 识别相关方)
  16. 气压传感器MPX4115学习笔记
  17. jk触发器改为四进制_数字电路学习笔记(十):更多锁存器和触发器
  18. ubuntu命令行 播放音乐
  19. 医疗:疫情下的人类高质量数据共享场景 | 2021隐私计算半年纪
  20. Clipper库中文文档(ClipperLib)

热门文章

  1. 计算机一级b考试电子表格,计算机等级考试一级B第1-50套题
  2. 10分钟学会spring代理模式以及应用原理,个人专用,不适合借鉴,请关闭文章
  3. python常见报错异常大全,根据异常找出根本问题,一键解决,建议收藏
  4. android实战技巧,实战技巧:Android异步指南
  5. linux 中文 bterm fbterm 内核,Fbterm (简体中文)
  6. css文本外观属性大全(内附实例与图解)
  7. sourcetree向github推送代码提示密码错误
  8. 华三交换机链路聚合的几点思考
  9. JSTL 核心标签库 使用(C标签)
  10. Android SDK Permission大全访问权限