吴恩达——机器学习(正则化Regularization)
正则化 Regularization
1、过拟合 overfitting
eg1:线性回归
图一:欠拟合,高偏差
图三:过拟合,高方差(一般在变量很多的时候发生,这种时候训练出的方程总能很好拟合训练数据,但是对于新的样本数据不能体现出很好的繁华能力)
eg2:;逻辑回归
图一:欠拟合,高偏差
图三:过拟合,高方差
如果我们有很多变量的假设模型,但是训练样本很少的时候,就会出现过拟合。
解决:
(1)减少选取变量的数量:
人工检测变量条目,挑选出重要的变量)
模型选择算法(自动选择采用哪些特征变量)
(2)正则化:
保留所以特征,减小数量级或者参数值的大小(可以防止信息丢失,因为每一个特征可能都会对预测值有影响)
2、损失函数
回到之前的例子,我们要拟合这些数据,如果采用右边的拟合方式,就会出现过拟合,现在我们要解决这种过拟合,我们采用的方法就是加入惩罚项,也就是正则项,在最小化函数的后面加上 1000^3+1000^3 要使得这个最小化函数取得最小值,那么、都要接近于0,这样就相当于变相弱化了、对式子的影响,是这个式子近似于一个二次函数,从而缓解过拟合程度。所以当参数值很小的时候,我们就能得到一个相对简单的假设函数。
对于房价预测的例子,如果有100个特征值,我们不知道哪些重要哪些不重要,我们采取在损失函数后面加上一个正则项,将每一个参数值都缩小
此处lamda是正则化参数,就是要在很好的拟合数据和控制过拟合(让参数值较小)中间的一个平衡
当lamda取一个很大的值的时候,参数值就趋近于0,就相当于假设函数就只有theta0,也就是意味着就拟合出了一条水平线,这就是欠拟合。所以lamda参数的选择要合适。
3、线性回归中的正则化
线性回归的优化目标:
(1)梯度下降法
我们先使用之前的方法求解没有正则项的式子,先把theta0分开,虽然这个没什么影响。然后跟之前一样求其偏导数,化简之后得到新的式子,我们可以看到thetaj和之前没加正则项时候的对比,就是乘以了一个(1-阿尔法*lamda/m)这个数字的值是很接近1的,所以可以看成是稍微压缩了thetaj 的值,然后后面减去的那一项就是和之前一样的。这就是加入了正则项产生的一点变化。
(2)normal equation
当我们用标准方程法加入正则项的时候,得到的theta如下,我们知道在lecture4 中有写到X转置*X有可能是不可逆的,加入了正则项之后那么他就是可逆的,这里不做证明。
4、逻辑回归中的正则化
(1)梯度下降
http://www.taodudu.cc/news/show-3782048.html
相关文章:
- 【深度之眼吴恩达机器学习第四期】笔记(五)
- Java EE中Ajax技术简单实现
- 吴恩达——机器学习(logistic)
- 《小白H5成长之路50》js与PHP配合完成图片上传功能
- 5G预计2020年商用,技术领先上市企业后市可期
- C++ perimer plus 第三章!
- 微信小程序基础入门
- SpringDataJPA 系列之 JPA 简介
- JPA系列一:简介
- JPA简单入门以及IDEA第一个JPA程序
- JPA 和 QueryDSL
- SpringDataJpa使用详解
- JPA框架
- JPA入门
- STM32—EXTI外部中断
- STM32F1----EXTI
- 第6课【EXTI中断】中断 事件 NVIC EXTI寄存器
- GD32系列单片机EXTI外部中断配置
- STM32 EXTI外部中断的使用
- STM32(五)——EXTI外部中断
- STM32-中断-NVIC与EXTI
- stm32——4、中断exti
- 记录一次EXTI使用中遇到的问题
- STM32中断:NVIC与EXTI
- 7-外部中断事件控制器(EXTI)
- STM32单片机学习笔记(八)-NVIC和EXTI
- EXIT外部中断实验——EXTI
- 28.EXTI外部中断原理与配置
- STM32中断—EXTI外部中断
- STM32 EXTI外部中断/事件
吴恩达——机器学习(正则化Regularization)相关推荐
- 吴恩达机器学习 -- 正则化
8.1 过拟合的问题 过拟合问题会导致线性回归和逻辑回归效果变差,那么过拟合到底是指什么意思呢? 一个回归问题的例子: 图一的线性回归模型,欠拟合:图三的逻辑回归模型虽然经过了所有的样本点,但是它预测 ...
- 带你少走弯路:五篇文章学完吴恩达机器学习
本文是吴恩达老师的机器学习课程[1]的笔记和代码复现部分,这门课是经典,没有之一.但是有个问题,就是内容较多,有些内容确实有点过时. 如何在最短时间学完这门课程?作为课程的主要翻译者和笔记作者,我推荐 ...
- 吴恩达机器学习笔记-应用机器学习的建议
评估假设 我们之前已经学习过一些机器学习的算法,现在我们来谈谈如何评估算法学习得到的假设.当发现预测的结果和实际的数据有误差的时候,我们需要进行一些调整来保证预测的准确性,大部分情况下,有以下几种办法 ...
- 下载量过百万的吴恩达机器学习和深度学习笔记更新了!(附PDF下载)
今天,我把吴恩达机器学习和深度学习课程笔记都更新了,并提供下载,这两本笔记非常适合机器学习和深度学习入门.(作者:黄海广) 0.导语 我和同学将吴恩达老师机器学习和深度学习课程笔记做成了打印版,放在g ...
- 吴恩达机器学习与深度学习作业目录 [图片已修复]
python3.6 (一) 吴恩达机器学习作业目录 1 吴恩达机器学习作业Python实现(一):线性回归 2 吴恩达机器学习作业Python实现(二):logistic回归 3 吴恩达机器学习作业P ...
- 吴恩达机器学习作业Python实现(八):异常检测和推荐系统
吴恩达机器学习系列作业目录 1 Anomaly detection 这部分,您将实现一个异常检测算法来检测服务器计算机中的异常行为.他的特征是测量每个服务器的响应速度(mb/s)和延迟(ms).当你的 ...
- 吴恩达机器学习作业Python实现(五):偏差和方差
吴恩达机器学习系列作业目录 在本练习中,您将实现正则化的线性回归和多项式回归,并使用它来研究具有不同偏差-方差属性的模型 1 Regularized Linear Regression 正则线性回归 ...
- 吴恩达机器学习作业Python实现(三):多类分类和前馈神经网络
吴恩达机器学习系列作业目录 1 多类分类(多个logistic回归) 我们将扩展我们在练习2中写的logistic回归的实现,并将其应用于一对多的分类(不止两个类别). import numpy as ...
- 吴恩达机器学习笔记(自用)
吴恩达机器学习 机器学习的定义 什么是机器学习? 机器学习算法 1.监督学习(Supervised Learning) 2.无监督学习(Unsupervised Learning) 单变量线性回归 模 ...
最新文章
- 多人开发情况下的字符串本地化
- 构建单层单向RNN网络对MNIST数据集分类
- 2020-12-15 IEEE写作格式
- Python基础06-Python异常处理
- 手机广告投放(phone advertising)唯一标识
- 两年还债4亿,罗永浩是如何做到的?
- 狸猫换太子--删除无头单链表中结点
- 理解伪元素:before和:after
- macOS图像文件不能正常显示缩略图预览怎么办?
- linux引导界面背景,如何个性化syslinux引导界面背景照片
- MySQL压缩包下载及解压安装
- html复习第七天 京东首页布局完成
- 集成微控制器使太阳能微型逆变器设计成本有效
- Connected to the target VM,address: ,transport: ‘socket‘
- 从键盘输入一个四位数,输出该四位数的个位,十位,百位和千位数分别是什么。
- 使用evo工具评估ORB_SLAM2在TUM数据集上的运行轨迹
- pythonmatplot教程_matplotlib入门实战全教程
- android到底要多少内存,手机内存究竟要多大才够用?
- Linux命令操作——常用解压缩命令
- 算法专家是否面临失业?一个YMIR搞定所有AI研发环节