1. 批量归一化Batch Normalization

2016年左右出来的





2. 代码实现




对比没有加BN 之前的效果,收敛没那么好


3. Q & A

    1. Batch Normalization BN 在比较深的神经网络里面效果比较明显,比较浅的神经网络里效果不一定好。
    1. batch norm 是个线性变化,所以一般用在激活函数之前

参考

https://www.bilibili.com/video/BV1X44y1r77r?p=1

批量归一化Batch Normalization 动手学深度学习v2相关推荐

  1. 李沐动手学深度学习v2/总结1

    总结 编码过程 数据 数据预处理 模型 参数,初始化参数 超参数 损失函数,先计算损失,清空梯度(防止有累积的梯度),再对损失后向传播计算损失关于参数的梯度 优化算法,使用优化算法更新参数 训练求参数 ...

  2. 动手学深度学习v2 p1引言 监督学习与无监督学习

    1.引言 1.2. 机器学习中的关键组件 首先介绍一些核心组件.无论什么类型的机器学习问题,都会遇到这些组件: 可以用来学习的数据(data): 如何转换数据的模型(model): 一个目标函数(ob ...

  3. new 动手学深度学习V2环境安装

    动手学深度学习V2 环境安装 虚拟环境 d2l-zh安装 conda create -n d2l-zh -y python=3.8 pip pip install jupyter d2l torch ...

  4. 使用AWS最便宜的GPU实例  from 动手学深度学习v2 李沐大神

    使用AWS最便宜的GPU实例  from 动手学深度学习v2 李沐大神 视频链接https://www.bilibili.com/video/BV1MA411L78X?t=493 由于购买的电脑没有配 ...

  5. 57 长短期记忆网络(LSTM)【动手学深度学习v2】

    57 长短期记忆网络(LSTM)[动手学深度学习v2] 深度学习学习笔记 学习视频:https://www.bilibili.com/video/BV1JU4y1H7PC/?spm_id_from=a ...

  6. 【动手学深度学习v2李沐】学习笔记07:权重衰退、正则化

    前文回顾:模型选择.欠拟合和过拟合 文章目录 一.权重衰退 1.1 硬性限制 1.2 柔性限制(正则化) 1.3 参数更新法则 1.4 总结 二.代码实现 2.1 从零开始实现 2.1.1 人工数据集 ...

  7. 动手学深度学习 v2 视频版

    动手学深度学习 v2 01 课程安排 目标 内容 形式 你将学到什么? 资源 02 深度学习介绍 AI 地图 图片分类 物体检测和分割 样式迁移 人脸合成 文字生成图片 文字生成 03 安装 本地安装 ...

  8. 《动手学深度学习v2》之细致解析(1)内容及介绍及安装

    前言 作者来自北京某不知名985,现在是本科在读学生,专业是数据科学与大数据技术,班上同学都太卷了,没办法,需要学习深度学习,经大佬介绍,在B站上找到了一个很不错的资源,李沐老师的<动手学深度学 ...

  9. 动手学深度学习V2——李沐Bilibili直播视频Jupyter Notebook安装

    在哔哩哔哩上发现李沐是视频直播讲解<动手学深度V2>- Pytorch,准备按照视频中的安装教程来搭建一个新的虚拟环境d2l,李沐使用的是Jupyter Notebook 而不是 Pych ...

  10. 08 线性回归 + 基础优化算法【动手学深度学习v2】

    线性回归 输出层不当成一层 输入层和权重层放一起 x和y是列向量 因为loss=1/2(y-y_hat)^2 又因为y_hat的平均值=1/n(xi*w+b)=1/n(Xw+b) 唯一一个有显示解的模 ...

最新文章

  1. vs2008常用操作汇总
  2. 《算法竞赛中的初等数论》(二)正文 0x20同余(ACM / OI / MO)(十五万字符数论书)
  3. 霸气侧漏HTML5--之--canvas(1) api + 弹球例子
  4. 【转】Hive学习路线图
  5. 关于java中的数组
  6. python extended,python list中的append 与 extended 的区别
  7. iscsi-分区类型
  8. Python 反爬篇之 ID 混淆
  9. mysql8.0登录不上去怎么回事_速看!智慧团建系统登录平台及信息查询入口
  10. websocket php apache,PHP第一篇:PHP WebSocket实现前后端数据交互,亲测可用(windows+ apache2.4 +php5.6 )...
  11. 802.11协议常用语缩写
  12. 吴琦:没有被“双非学历”困住的边界突破者
  13. c语言的虚拟变量,含有分类变量(categorical variable)的逻辑回归(logistic regression)中虚拟变量(哑变量,dummy variable)的理解...
  14. 小米手机 怪诞行为经济学
  15. 产品分析 淘宝、京东、平多多
  16. 点仙人掌(cactus)
  17. Windows 10上的LockApp.exe是什么?
  18. 教你十分钟在Linux系统上快速装机并安装Ansible
  19. 深入探索Android卡顿优化
  20. 58同城产品2面面经

热门文章

  1. 使用计算机音箱进行音乐播放的过程,插卡音箱音乐播放顺序调整及歌单式1
  2. 30分钟学习掌握springmvc、SSM
  3. sequelize 连接2个数据库_Sequelize如何同步判断数据库连接及同步成功
  4. 简单的网站项目开发流程 .
  5. 07-12-Exchange Server 2019-安装-CU1
  6. symbolicatecrash App Bug 分析工具
  7. 网友神总结:我们继续用 XP 的十大理由
  8. Solr schema编写指导
  9. react实现聊天界面_React-Redux 100行代码简易版探究原理
  10. python集合常用方法_python基础-集合set的常用方法