看了很多资料,本身想放一个正则化的概念的,实在不敢放,怕吓跑一堆人,所以,将就吧。

首先,我们知道正则化(Regularization)是解决过拟合问题的,简单来说,过拟合(也叫高方差)就是训练样本效果比较好,但是在测试集上的效果就比较差了,官方一点的话就是模型的泛化能力太差。

泛化能力:一个假设模型能够应用到新样本的能力。

解决过拟合我们可以采用

(1)丢弃一些不能帮助我们正确预测的特征,可以手工保留,也可以采用算法(例PCA)

(2)正则化处理。保留所有的特征,但是减少参数的大小。

正则化的方式有很多,常见的有数据增强、L1正则化,L2正则化,早停,Dropout等。

正则化代价函数 =经验代价函数 +正则化参数 *正则化项

其中,经验损失函数就是我们所说的损失函数,最小化误差让模型更好拟合训练集

范数的概念:

从概率角度进行分析,很多范数约束相当于对参数添加先验分布,其中L2范数相当于参数服从高斯先验分布,L1范数相当于拉普拉斯分布。从贝叶斯的角度来分析, 正则化是为模型参数估计增加一个先验知识,先验知识会引导损失函数最小值过程朝着约束方向迭代。

相关资料表示:

L0和L1可以解决稀疏问题

L0 问题是NP组合难问题,对较大规模数据无法直接求解;

存在两种直接求解L0问题的算法:

(1)贪婪算法

(2)门限算法

问题:

(1)贪婪算法时间代价过高,无法保证收敛到全局最优

(2)门限算法时间代价低,但对数据噪声十分敏感。解不具有连续性 ,无法保证全局最优解。

L0应用场景:压缩感知、稀疏编码

L0过渡到L1:从一个组合优化问题放松 到凸优化问题来解,L1范数是L0范数的最优凸近似

实线的椭圆代表示没有正则化目标的等值线,虚线圆圈表示L1正则化的等值线

里边涉及一堆数学推理,我简化来说,L1正则化可以产生稀疏矩阵(去掉没用的特征,将权重置为0),有利于特征选择。

扩充:参考https://wenku.baidu.com/view/00613bc4f78a6529657d536c.html?from=search

L2(Tikhonov正则) 权重衰减

目标是通过向目标函数添加一个正则项,使权重更加接近原点。

实线的椭圆代表示没有正则化目标的等值线,虚线圆圈表示L2正则化的等值线

在岭回归中,我们主要解决的问题就是特征数大于样本数的情况,也是奇异矩阵问题。

奇异矩阵:若存在X的列间存在完全的线性依赖,即它的某一或某些列元素正好是另一或另一列元素的线性函数,这称为共线性   或多重共线性。X的共线性必然导致的列间和行间存在共性,并使得奇异,即行列式的值为0,。则无法求解矩阵的逆。

在回归分析中,存在着近似于但不同于奇异矩阵的情况,即行列式的值近似于0,此类矩阵通常称为病态矩阵或者近奇异矩阵。   L2范数有助于计算病态问题。

过拟合问题——正则化方法相关推荐

  1. 正则化方法/防止过拟合提高泛化能力的方法:L1和L2 regularization、数据集扩增、dropout

    转载自:http://blog.csdn.net/u012162613/article/details/44261657 本文是<Neural networks and deep learnin ...

  2. 花书+吴恩达深度学习(五)正则化方法(防止过拟合)

    目录 0. 前言 1. 参数范数惩罚 2. Dropout 随机失活 3. 提前终止 4. 数据集增强 5. 参数共享 如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔~我会非常开心的~ 花书+ ...

  3. MXNET深度学习框架-09-使用正则化方法解决过拟合问题(以从0开始的线性回归为例)

    本章我们使用一个高维线性回归的例子来做解决过拟合的问题. 相关公式:          y=0.05+∑i=1p0.01xi+noisey=0.05+\sum_{i=1}^p0.01x_i+noise ...

  4. 防止模型过拟合的必备方法!

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货 作者:Mahitha,来源:机器之心 正如巴菲特所言:「近似的正确好过精 ...

  5. 干货|深度学习之过拟合和正则化

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 一.过拟合,欠拟合 过拟合(overfitting):学习能力过强 ...

  6. 人工智能算法模型必会之——正则化方法综述

    https://www.toutiao.com/a6718749367164994055/ 什么是正则化? 首先英文原文为regularization,直译应为规则化,简单来说就是对模型加入规则,加入 ...

  7. 正则化方法:L1和L2 regularization、数据集扩增、dropout

    https://www.toutiao.com/a6704868049352131080/ 为什么要使用正则化 我们先回顾一下房价预测的例子.以下是使用多项式回归来拟合房价预测的数据: 正则化方法:防 ...

  8. 机器学习中防止过拟合的处理方法

    原文地址:一只鸟的天空,http://blog.csdn.net/heyongluoyao8/article/details/49429629 防止过拟合的处理方法 过拟合   我们都知道,在进行数据 ...

  9. 防止过拟合的处理方法

    原文地址:一只鸟的天空,http://blog.csdn.net/heyongluoyao8/article/details/49429629 防止过拟合的处理方法 过拟合   我们都知道,在进行数据 ...

最新文章

  1. ggplot2 图形排版:patchwork 包简单入门
  2. php数据库重复记录数,php – 每隔30分钟计算一次数据库上的重复...
  3. Pyhon爬虫开发:URLError的使用
  4. oracle for循环
  5. RabbitMQ之队列优先级
  6. navicat10.1.7英文版_【纯干货】风险评估和管理(PDA TR 49内容节选11 中英文版)...
  7. Java中的迭代器设计模式–示例教程
  8. 蚂蚁森林快捷指令_iPhone「快捷指令」怎么玩?玩法太多,别让这个功能吃灰
  9. 关于android各种双卡手机获取imei,imsi的处置(mtk,展讯,高通等)
  10. 月薪7万,还想着赚“外快”,吃百万回扣, 这名大公司85后员工结局唏嘘
  11. iPhone 12的尺寸有变化:可能比新款iPhone SE还小
  12. 手机Web 开发中图片img 如何等比例缩放
  13. Eclipse 中最常用的快捷键大全
  14. STM32F4 + HAL库 + W25Q256的验证
  15. 理解和选择运行时安全自保护-RASP
  16. oracle12c 配置监听,redhat上oracle 12c配置监听
  17. java把汉字转换成拼音_Java实现汉字转换为拼音
  18. 【强烈推荐】Windows 更新疑难解答(转贴)
  19. 如何知道,你真正想要什么?
  20. 如何使用OBS 进行屏幕录制

热门文章

  1. Unique Binary Search Trees
  2. 视频下载比想象中容易
  3. @Pointcut的用法
  4. Ubuntu中安装nginxError
  5. kotlin将对象转换为map_Kotlin程序将哈希映射(HashMap)转换为列表(List)
  6. Python 之 Python2 和 Python3 的区别
  7. 递归应用场景和调用机制
  8. 初学大数据之模块集成:Pycharm安装numpy,scipy,sklearn等包时遇到的各种问题的一键解决方法
  9. UIBezierPath
  10. linux 检测蓝牙 rssi,树莓派开发笔记(十一):蓝牙的使用,BlueZ协议(双树莓探测rssi并通过蓝牙互传获取的rssi信号强度)...