1、深度学习偏置的作用?

x1w1 + x2w2 +…+xnwn > T(T为一个阈值),而T越大,想激活这个感知器的难度越大,人工选择一个阈值并不是一个好的方法,因为样本那么多,我不可能手动选择一个阈值,使得模型整体表现最佳,那么我们可以使得T变成可学习的,这样一来,T会自动学习到一个数,使得模型的整体表现最佳。当把T移动到左边,它就成了偏置,x1w1 + x2w2 +…+xnwn - T> 0 ----->x*w +b > 0,总之,偏置的大小控制着激活这个感知器的难易程度。

2、在某些情况下,我们是否可以不要偏置呢?

1)bias被设置False,也就是没有用到偏置。

def conv_bn(inp, oup, stride):return nn.Sequential(nn.Conv2d(inp, oup, 3, stride, 1, bias=False),nn.BatchNorm2d(oup),nn.ReLU(inplace=True))

2)bias被设置为True,用到了偏置。

def conv3x3(in_channels, out_channels, stride=1, padding=1, bias=True, groups=1):    """3x3 convolution with padding"""return nn.Conv2d(in_channels, out_channels, kernel_size=3, stride=stride,padding=padding,bias=bias,groups=groups)

这两份的代码区别在于卷积后面有没有接BN操作(后面我会有博客讲归一化操作,这里就不展开了)

BN操作,里面有一个关键操作:

其中x1 = x0 * w0 + b0,而E[x1] = E[x0*w0] + b0, 所以对于分子而言,加没加偏置,没有影响;而对于下面分母而言,因为Var是方差操作,所以也没有影响。所以,卷积之后,如果要接BN操作,最好是不设置偏置,因为不起作用,而且占显卡内存。

深度学习中,偏置(bias)在什么情况可以不要?相关推荐

  1. 计算机偏置,深度学习中偏置的作用

    AI开发平台ModelArts ModelArts是面向开发者的一站式AI开发平台,为机器学习与深度学习提供海量数据预处理及半自动化标注.大规模分布式Training.自动化模型生成,及端-边-云模型 ...

  2. 深度学习中的语音信号处理基础

    文章目录 音频处理流程 常用谱:幅度谱.梅尔谱 时域 --> 频域 分帧 窗长 帧移 语音信号特征获取流程 梅尔谱 使用 librosa 提取梅尔谱 使用 tacotron 获取梅尔谱(推荐) ...

  3. 深度学习中的优化算法之BGD

    之前在https://blog.csdn.net/fengbingchun/article/details/75351323 介绍过梯度下降,常见的梯度下降有三种形式:BGD.SGD.MBGD,它们的 ...

  4. AI部署:聊一聊深度学习中的模型权重

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨Oldpan 来源丨Oldpan博客 编辑丨极市平台 导读 本文简要介绍了模型权重的统计方法,以 ...

  5. 深度学习中的正则化技术详解

    目录 基本概念 1. 参数范数惩罚 1.1 \(L^2\)正则化 1.2 \(L^1\)正则化 1.3 总结\(L^2\)与\(L^1\)正则化 2. 作为约束的范数惩罚 3. 欠约束问题 4. 数据 ...

  6. 深度学习中的优化方法总结

    转载自:https://blog.csdn.net/u012151283/article/details/78154917 梯度下降沿着整个训练集的梯度方向下降.可以使用随机梯度下降很大程度地加速,沿 ...

  7. 深度学习中的卷积操作

    本文从信号处理中的互相关运算引入深度学习中的卷积. 然后介绍了不同的卷积类型,以及如何在pytorch中使用这些卷积层. (在看pytorch文档中的Conv1D/2D/3D的时候感到比较困惑,又很好 ...

  8. 深度学习中的优化算法之MBGD

    之前在https://blog.csdn.net/fengbingchun/article/details/75351323 介绍过梯度下降,常见的梯度下降有三种形式:BGD.SGD.MBGD,它们的 ...

  9. 深度学习中的优化简介

    深度学习算法在许多情况下都涉及到优化. 1. 学习和纯优化有什么不同 在大多数机器学习问题中,我们关注某些性能度量P,其定义于测试集上并且可能是不可解的.因此,我们只是间接地优化P.我们系统通过降低代 ...

  10. 深度学习中GPU和显存分析

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 转自:机器学习AI算法工程 深度学习最吃机器,耗资源,在本文,我将 ...

最新文章

  1. 分布式服务限流实战,已经为你排好坑了
  2. mysql 流复制_MySQL系列详解六:MySQL主从复制/半同步演示-技术流ken
  3. iOS - UISearchController
  4. java 代码 内存泄露_如何用Java编写一段代码引发内存泄露
  5. Winform中在使用Dock属性设计页面布局控件的顺序导致页面效果不同的问题
  6. oKit项目管理软件试用及感受
  7. AM,DSB,SSB,FM信号调制matlab
  8. 【计算机科学基础】计算机不需要整数减法器的原因
  9. python中while语句的用法_全面解析Python的While循环语句的使用方法
  10. 机器学习-斯坦福:学习笔记7-最优间隔分类器问题
  11. 洛谷P1015回文数
  12. Pa2 函数指针 指针函数 分析 (转)
  13. 主从复制面试之作用和原理
  14. 项目杂识-FOV(视场角)
  15. 成年人改名字要哪些步骤和手续?
  16. 【Matlab】希腊字母
  17. 安装惠普打印机显示等待php,安装惠普打印机出现“新设备现已连接”一直不动怎么办?...
  18. APP后台服务器阿里云Win系统服务器搭建的方法
  19. 【项目总结】基于SpringBoot+Ansj分词+正倒排索引的Java文档搜索引擎项目总结
  20. jQuery多余文字折叠效果

热门文章

  1. Linux系统的信号详解
  2. 视频像素数据_从摄像头到驱动
  3. linux 版本二进制编辑工具bless(嵌入式工具集合)
  4. [WinError 10060]错误
  5. 视频安防“上帝视角“的畅想
  6. 阻容感基础02:电阻器原理(2)-电阻器参数
  7. MySQL——插入数据
  8. Mysql-查询并插入
  9. 电信短信网关ISAG-SMS二次开发
  10. MyBatis使用@Select注解写动态SQL语句