文章目录

  • 归纳偏差
  • 选择性偏差
  • 两者区别
  • 适用情况
  • 常见的归纳偏差
    • 1. 正则项
    • 2. Batch Normalization和Layer Normalization
    • 3. 常见深度学习网络中的归纳偏差
  • 牢骚

归纳偏差

归纳偏差(Inductive biases)可以理解为一种先验或约束,他能够帮助我们在多个可能的模型中选择出一个。比如奥卡姆剃刀原则,他指示我们,在多个模型都符合条件时,我们选择最简单的那个

正则项(regularization term)可以看作是在奥卡姆剃刀原则下指导的一个表现,我们想要选择最简单的那个模型,可以通过使得模型所有的系数朝零的方向进行约束、调整或缩小;所以,最小化正则项,就可以看作是我们加在模型中的归纳偏置

除了最小化正则项外,CNN中的 也是较为常见的归纳偏差

选择性偏差

选择性偏差(selection bias)是指,用于分析的数据不能保证随机化得方法获得,因此从样本中分析的结果不能代表总体特征

如果样本的选择过程依赖了某个变量,而这个变量恰好是你关注的的变量的共同结果,则会导致选择性偏差

两者区别

归纳偏差,是我们主动加在模型中的,为了解决一些问题而存在的;而选择性偏差,是我们被动引起的,可能来源于数据集收集过程中不可避免的结果

加入归纳偏差可以提升模型的泛化能力,而解决选择性偏差才可以提升泛化能力

适用情况

并不是所有的模型都需要添加归纳偏差,因为比如最小化正则项这个归纳偏差,本质上来说,是为了解决模型过拟合,即模型过度地关注数据集的某些“个性”,从而限制了模型的泛化能力;然而,如果有些模型中出现了选择性偏差,那么正确的问题解决顺序是:解决选择性偏差–>模型出现问题(比如过拟合)–>加入归纳偏差

常见的归纳偏差

下面,介绍一些深度学习模型中常见的归纳偏差,比如为了解决过拟合问题的正则项和dropout;为了解决梯度消失问题的Batch Normalization和Layer Normalization;以及全连接层、卷积网络、循环神经网络、图网络这些常见的网络结构中用到的归纳偏差。下面我们将一一介绍

1. 正则项

为了更好地理解,为何"最小化正则项"可以成为一种归纳偏差,我们可以看下图:

以其中的第三个为例,这张图描述的是:x2+y2=mx^2+y^2=mx2+y2=m,其中mmm表示某个常数,而我们的添加的正则项通常是:λx2+y2\lambda \sqrt{x^2+y^2}λx2+y2​(这里假设x,yx, yx,y均是模型中的参数,且使用L2L_2L2​正则项),所以我们的目标就是使得mmm尽可能小,落实到三维图上,就是下图中的第三个,我们要使得圆锥的高度尽可能小:

然而,真正的模型,不可能只需要正则项这一个约束,所以我们在保证尽可能小的同时,还需要寻找与模型其他约束相交的交点

2. Batch Normalization和Layer Normalization

之前写过一篇关于Batch Normalization和Layer Normalization,从直觉出发的理解向文章,欢迎访问:【直觉建设】矩阵取用的常用方式与Batch Normalization、Layer Normalization

3. 常见深度学习网络中的归纳偏差


主要观点都来自于Relational inductive biases, deep learning, and graph networks这篇综述类文章的Section 2. 这里主要介绍全连接网络和卷积神经网络

全连接网络,实体是单元,由于每个单元之间都会建立联系,因此全连接网络中的归纳偏差很弱(大概可以理解为,全连接规划了规则下所有可能的函数,代表其没有使用什么先验或限制)

卷积网络,实体是网络或像素,主要使用了两种归纳偏差:局部性(locality)和平移不变性(translation invariance);局部性是指,关系规则的对象限制在那些在输入信号的坐标空间下(大概指的是卷积核的感受野)紧密接近的实体,远离了那些末端实体;平移不变性是指,输入的各个局部位置会使用同样的规则

牢骚

今天又开始递归式学习了,即准备学一个知识的时候,发现其中有个背景知识需要补,而在补这个背景知识的时候,又发现其他背景知识…

今天的递归式学习始于SegFormer代码的使用,但在扣代码时,发现很多不理解的点,比如参数的含义、数据集需要的格式等等;于是点开了SegFormer的论文,在读引入的时候提到了ViT模型不能直接应用于语义分割任务的弊端;于是又点开ViT的论文,然后发现对归纳偏差理解得不是很透彻,于是又着手来理解归纳偏差;归纳偏差中又提到正则项也是一种归纳偏差,而我一时get不到这两者之间的关系,之后又慢慢想到,怎么自己的领域没有人使用正则化项呢?于是有了这一篇主理解向的文章

【直觉建设】归纳偏差与选择性偏差相关推荐

  1. 【理论知识学习32】归纳偏差与选择性偏差(概念作用以及举例说明)

    呆呆象呆呆的所有博客目录 一.inductive bias 归纳偏置 1.1 背景与概念介绍 No-Free-Lunch (不存在免费午餐理论)提出没有先验知识进行学习是不可能的.如果我们不对特征空间 ...

  2. 【转载】数据分析中的两种偏差(选择性偏差、幸存者偏差)

    作者:张俊红 来源:俊红的数据分析之路 补充:幸存者偏差(survivorship bias) 总第171篇/张俊红 今天给大家介绍一下数据分析中常见的两种偏差:选择性偏差和幸存者偏差. 1.选择性偏 ...

  3. 方差偏差权衡_偏差偏差权衡:快速介绍

    方差偏差权衡 The bias-variance tradeoff is one of the most important but overlooked and misunderstood topi ...

  4. 语言认知偏差_认知偏差以及为什么绩效管理如此困难

    语言认知偏差 by Osman (Ozzie) Ahmed Osman 通过奥斯曼(Ozzie)艾哈迈德·奥斯曼 认知偏差以及为什么绩效管理如此困难 (Cognitive Bias And Why P ...

  5. 深度理解期望、方差偏差与方差偏差分解

    前言 我们经常用偏差-方差分解形式来度量机器学习模型泛化能力的内容.本文将从数学基础来解释其演进过程.我们先从数学期望开始. 1.数学期望 概率论是描述现实世界的一个重要学科.我们从现实世界了解数学规 ...

  6. 【直觉建设】对卷积的理解

    引言 卷积,高数上的惊鸿一瞥,深度学习中熟悉的陌生人,这次终于决定来好好了解你,希望今后咱们的感情可以一直牢固- 本质 卷积描述了三个函数之间的关系,这里设为 f , g , w f, g, w f, ...

  7. 数据分析中的两种偏差

    总第171篇/张俊红 今天给大家介绍一下数据分析中常见的两种偏差:选择性偏差和幸存者偏差. 1.选择性偏差 选择性偏差指的是在研究过程中因样本选择的非随机性而导致得到的结论存在偏差,是由于人为主观的选 ...

  8. 终于有人把幸存者偏差讲明白了

    导读:本文带你了解数据收集的偏差. 作者:徐晟 来源:大数据DT(ID:hzdashuju) 数据收集是一项重要的工作,需要投入大量精力和时间,这是因为数据质量直接关乎分析结论的成败.然而,错误的数据 ...

  9. 【机器学习】浅谈 归纳偏置 (Inductive Bias)

    目录 一.概念 二.例子 三.意义 一.概念 在机器学习中,很多学习算法经常会对学习的问题做一些关于目标函数的必要假设,称为 归纳偏置 (Inductive Bias). 归纳 (Induction) ...

最新文章

  1. C#基础全接触分类:asp.net技术
  2. Watcher 实现机制之client注冊
  3. debian/deepin 15.3 15.4安装jdk 1.7 (或jdk 7),配置默认环境
  4. HH SaaS电商系统的商品营销服务功能模块设计
  5. javax.imageio.IIOException: Unsupported Image Type
  6. mysql round 0.1111_听说Mysql你很豪横?-------------分分钟带你玩转SQL高级查询语句(库函数,存储过程)...
  7. CCF-CSP/202206-2—寻宝!大冒险!c++解题思路
  8. Flutter+原生开发与H5+原生开发的区别在哪里?
  9. 免费微信登陆界面html模板,微信小程序:使用微信授权登录以及页面模板
  10. 发现一个可以让程序员提神的方法
  11. 485集线器在安防监控系统的应用
  12. 一段Js代码开启任意网站的匿名在线聊天室
  13. RSA加密应用常见缺陷的原理与实践
  14. 靶机17 GROTESQUE: 3.0.1
  15. 心理学家:人生最可怕的不是失去爱,而是失去这种能力
  16. Bzoj4766 文艺计算姬
  17. dfc trace performance anaysis
  18. 7-20 电话聊天狂人(25 分)(Hash模板)
  19. QQ聊天记录快速迁移
  20. 淘宝API接口如何调取产品数据?

热门文章

  1. 服装企业如何保持品牌的影响力
  2. java ofbiz_Ofbiz初探
  3. eve正在跃迁服务器维护,【终极跃迁测试】新伊甸常见问题答疑
  4. 一名普通测试人员的年总结报告
  5. 解读到底什么是硬件工程师?
  6. 直线检测之LSD算法及其OpenCV/C++案例实现
  7. linux mint 18 中文版,linux mint 18.2
  8. 3DLC系列:LUT 管理器
  9. android提供的安全功能电力仪表,多功能电力仪表的接线须知,安全的前提是你有充足的技术知识!...
  10. YOLOv5+DeepSort多目标跟踪教程