吴恩达机器学习(五)正则化(解决过拟合问题)
目录
0. 前言
1. 正则化(Regularization)
2. 线性回归中的正则化
3. 逻辑回归中的正则化
学习完吴恩达老师机器学习课程的正则化,简单的做个笔记。文中部分描述属于个人消化后的理解,仅供参考。
如果这篇文章对你有一点小小的帮助,请给个关注喔~我会非常开心的~
0. 前言
在分类或者回归时,通常存在两个问题,“过拟合”(overfitting)和“欠拟合”(underfitting).
- 过拟合:曲线为了减少代价函数,一味地拟合数据,使得样本中几乎每一个数据都能正确被分类(回归),导致过度拟合,不能泛化新的样本,通常具有高方差(high variance)
- 欠拟合:曲线的拟合度不够,太多的数据并没有被拟合到,通常具有高偏差(high bias)
通常,在过拟合的情况中,存在过量的特征,有以下两种解决办法:
- 减少特征量
- 采用正则化
1. 正则化(Regularization)
由于造成过拟合的原因可能是太多的特征量,所以可采用减少特征量的方法。但是不妨换种思路,减少特征量的权值(这个特征乘以的 很小),来达到目的。
例如,对于 ,已知 的关联度不大,我们需要减少它的权值(),可将代价函数修改为 ,这样为了降低 ,就会使得 ,达到了减小特征的目的。
但是通常,我们不知道哪些特征量是无关的,所以给出修改后的代价函数定义:
其中, 称为正则化参数, 称为正则项,目的是使得 减小。正则化使得假设函数更加简单,减小发生过拟合概率。
注:如果 过大,会造成 ,使得 ,造成欠拟合。
2. 线性回归中的正则化
在线性回归中运用正则化,我们已知代价函数和梯度下降法如下定义:
代入可得:
其中,,所以相当于 乘以一定的权值,然后再减去梯度下降的变化量。
同样,在正规方程中,也可以使用正则化:
此时,可以保证,中间项一定不是奇异矩阵,一定存在逆矩阵。
3. 逻辑回归中的正则化
与上述类似,代价函数可表示为:
梯度下降法可表示为:
逻辑回归中的 是在 外包裹了一层 函数的,与线性回归不同,所以梯度下降法看似相同却不同。
如果这篇文章对你有一点小小的帮助,请给个关注喔~我会非常开心的~
吴恩达机器学习(五)正则化(解决过拟合问题)相关推荐
- 吴恩达——机器学习(正则化Regularization)
正则化 Regularization 1.过拟合 overfitting eg1:线性回归 图一:欠拟合,高偏差 图三:过拟合,高方差(一般在变量很多的时候发生,这种时候训练出的方程总能很好拟合训练数 ...
- 吴恩达机器学习(十七)过拟合、正则化下的代价函数
文章目录 1.过拟合 2.正则化下的代价函数 1.过拟合 包插线性回归和逻辑回归等的几种学习算法能够有效解决许多问题,但是当它们应用到某些特定的机器学习应用时,会遇到过度拟合的问题,导致它们表现欠 ...
- 吴恩达机器学习 5.正则化
1.理解过拟合问题 在训练集的基础上用模型去拟合,得到的假设可能能够非常好地适应训练集(代价函数可能几乎为0,即最小化J(θ)J(\theta)J(θ)几乎为0),但是可能会不能推广到新的数据. 举例 ...
- 吴恩达机器学习(五)逻辑回归练习-二分类练习
1.基础内容 (1)公式总结: (2)内容回归: 逻辑回归主要是进行二分类和多分类. 二分类中,分为线性可分和线性不可分. 对于线性回归模型,我们定义的代价函数是所有模型误差的平方和.理论上来说,我们 ...
- 带你少走弯路:五篇文章学完吴恩达机器学习
本文是吴恩达老师的机器学习课程[1]的笔记和代码复现部分,这门课是经典,没有之一.但是有个问题,就是内容较多,有些内容确实有点过时. 如何在最短时间学完这门课程?作为课程的主要翻译者和笔记作者,我推荐 ...
- 吴恩达机器学习作业Python实现(五):偏差和方差
吴恩达机器学习系列作业目录 在本练习中,您将实现正则化的线性回归和多项式回归,并使用它来研究具有不同偏差-方差属性的模型 1 Regularized Linear Regression 正则线性回归 ...
- 【吴恩达机器学习】第五周课程精简笔记——代价函数和反向传播
Cost Function and Backpropagation(代价函数和反向传播) 1. Cost Function Let's first define a few variables tha ...
- 吴恩达机器学习(十一)—— 应用机器学习的建议
吴恩达机器学习系列内容的学习目录 → \rightarrow →吴恩达机器学习系列内容汇总. 1. 决定下一步做什么 2. 评估假设函数 3. 模型选择和训练.验证.测试集 4. 诊断偏差和方差 5. ...
- 吴恩达机器学习笔记(自用)
吴恩达机器学习 机器学习的定义 什么是机器学习? 机器学习算法 1.监督学习(Supervised Learning) 2.无监督学习(Unsupervised Learning) 单变量线性回归 模 ...
- 【CV】吴恩达机器学习课程笔记第10章
本系列文章如果没有特殊说明,正文内容均解释的是文字上方的图片 机器学习 | Coursera 吴恩达机器学习系列课程_bilibili 目录 10 应用机器学习的建议 10-1 决定下一步做什么 10 ...
最新文章
- php改7z,PHP的7z扩展名? - php
- nfs服务端服务停掉,导致的客户端访问挂载目录卡死的情况
- 《从零开始学Swift》学习笔记(Day 6)——哎呀常量和变量都该什么时候用啊?...
- 用gnuplot画出c产生数据的波形图
- 【远程操控】Pycharm远程连接服务器之本地显示独立的plot窗口
- Lock同步锁--线程同步
- 利用python去除红章
- 专家支招:如何利用Plesk搭建完美全能开发环境
- [luoguP1029] 最大公约数和最小公倍数问题(数论)
- 域控制器的强制卸载,Active Directory系列之十四
- easyui汉化啊!
- Flash已死,有事烧纸!
- @程序员们,华为员工 300 万分红,老板给你多少年终奖?
- jquery系列教程3-DOM操作全解
- Windows核心编程_在Visual Studio窗口输出调试信息
- 助听器声音大了会不会对耳朵有影响
- Windows--IOmeter测试网络
- android辅助功能截屏,Android 截屏的三种方法
- excel 第18讲:lookup函数与数组
- H5页面调用微信扫一扫
热门文章
- HTML meta 标签总结
- RequiredFieldValidator验证下拉列表框
- ZT 为什么pthread_cond_t要和pthread_mutex_t同时使用 || pthread/Linux多线程编程
- MySQL索引背后的数据结构及算法原理(employees实例)
- BZOJ.3990.[SDOI2015]排序(DFS)
- 什么是JAP,什么是ORM,与hibernate的关系
- 搬砖的也能学Python----if - elif 语句
- RESTFUL协议入门介绍
- [c/c++] programming之路(12)、循环结构
- jQuery 查找父元素