什么是非饱和神经元(non-saturating neurons)

在读AlexNet文章时,在Abstract中发现有non-saturating neurons一词,于是想知道什么是non-saturating neurons。参考知乎回答:https://www.zhihu.com/question/264163033/answer/277468264

  1. 含义
    non-saturating neurons = 没有被挤压(到一个特定的区间)处理过的值

    saturating neurons = 被挤压(到一个特定的区间)过的值
    关键:1.值是否被挤压 2.值有无最大最小限制

  2. 输出saturating neurons的activation:
    sigmoid: input neurons的值会被挤压到[0,1]的区间

    tanh:input neurons的值会被挤压到[-1,1]的区间

  3. 输出non-saturating neurons 的activation:
    relu:input neurons的值,要么变0, 要么保持原值(无挤压,无最大最小值限制)

    leaky_relu:input neurons的值, 要么按照某比例缩小,要么保持原值(无挤压,无最大最小值限制)

  4. 为什么要用relu这样的能生成non-saturating neurons的non-linear activations, 而不用生成saturating neurons的sigmoid或tanh?
    规避vanishing, exploding of gradients 带来的gradient值过大过小,导致训练效率低下。

非饱和神经元(non-saturating neurons)相关推荐

  1. non-saturating neurons非饱和神经元、saturating neurons饱和神经元 的含义和区别

    参考知乎回答:https://www.zhihu.com/question/264163033 含义: non-saturating neurons = 没有被挤压(到一个特定的区间)处理过的值 sa ...

  2. non-saturating neurons非饱和神经元

    输出saturating neurons的activation: sigmoid: input neurons的值会被挤压到[0,1]的区间 tanh:input neurons的值会被挤压到[-1, ...

  3. 独家 | 人工神经网络中发现了人类大脑拥有的多模态神经元(附链接)

    作者:Gabriel Goh, Chelsea Voss, Daniela Amodei, Shan Carter, Michael Petrov, Justin Jay Wang, Nick Cam ...

  4. 北京大学 微软:预训练模型(Transformer)中的知识神经元

    ©作者 | 方鱼 单位 | 北京科技大学 研究方向 | 问答系统 大型预训练语言模型能很好的记忆训练语料中的事实知识.在这篇文章中,我们探究隐式知识如何存储在预训练 Transformers 中,引出 ...

  5. Brian2学习笔记一 Introduction to Brian part1:Neurons

    Brian2学习笔记一 Introduction to Brian part 1 :Neurons 1. 前言 2. 正文 2.1 单位系统(Units system) 2.2 一个简单的模型(A s ...

  6. Ordered Neurons: Integrating Tree Structures into Recurrent Neural Networks

    写在前面 这个是对 这篇论文主要解决了一个问题: 提出了ON-LSTM框架 理解这个ON-LSTM框架也是比较重要 推介https://blog.csdn.net/c9Yv2cf9I06K2A9E/a ...

  7. Hinton Neural Networks课程笔记1c:几种激活函数Linear、Binary、ReLU、Stochastic binary neurons

    转载自:https://blog.csdn.net/silent56_th/article/details/75736028 本章简单介绍了一些神经元的激活函数,包括Linear.Binary.ReL ...

  8. 论文研读 —— 6. ImageNet Classification with Deep Convolutional Neural Networks (2/3)

    文章目录 3. The Architecture 3.1. ReLU Nonlinearity 3.2. Training on Multiple GPUs 3.3. Local Response N ...

  9. 《每日论文》ImageNet Classification with Deep Convolutional Neural Networks

    这篇论文是剖析 CNN 领域的经典之作,也是入门 CNN 的必读论文.作者训练了一个面向数量为 1.2 百万的高分辨率的图像数据集 ImageNet, 图像的种类为 1000 种的深度卷积神经网络. ...

最新文章

  1. 在离线环境中安装Visual Stuido 2017
  2. Hash-哈希/散列
  3. SSH学习-Hibernate对象生命周期管理
  4. JavaFX自定义控件– Nest Thermostat第2部分
  5. activitimq集群搭建_activitmq+keepalived+nfs 非zk的高可用集群构建
  6. h5文字垂直居中_CSS中垂直居中和水平垂直居中的方法
  7. .NET、TensorFlow和Kaggle的风车
  8. python安装request失败_在python 虚拟环境下使用命令pip install -r request 安装软件失败?...
  9. 图档生成bin文件_「嵌入式笔记」hex文件、bin文件、axf文件的区别?
  10. c++ primer plus(第6版)中文版 第十二章编程练习答案
  11. DHCP DHCPv6
  12. 修改页面变成灰色代码修改方法
  13. composer更换国内镜像地址
  14. Spark高级分析与机器学习笔记
  15. 项目管理之如何做好项目经理
  16. 运动控制器轴回零的配置与实现
  17. 虾皮API接口—获取商品详情
  18. 教师节祝福语太单调?来用PaddleHub生成独家祝福语
  19. 互联网早报:腾讯 QQ“兴趣部落”宣布全面停止运营并下线....
  20. 程序员小猪队友行为大赏

热门文章

  1. Mycat数据库中间件-入门
  2. Scrapy爬虫实战| 手把手教你使用CrawlSpider框架爬取数码宝贝全图鉴
  3. 密友破解版激活和使用方法
  4. 网易云信参编中国信通院《智能双录系统基础能力要求》标准正式发布
  5. MybatisPlus IPage分页无效
  6. 计算机屏幕解锁,电脑屏幕解锁按哪个键
  7. Java运行时环境初始化出现错误
  8. Go:You-Get 简介
  9. c语言程序运行时打开记事本,C语言打开一个记事本的内容!求助!
  10. 长期熬夜——真的不好