机器学习(五)——正规化
目录
一、前言
二、过拟合
三、代价函数:
四、线性回归正则化
1、梯度下降
2、正规方程
五、Logistic回归正规化
一、前言
- 吴恩达机器学习第八章——正规化 笔记
- 所有图片与例子均来自吴恩达视频课
二、过拟合
欠拟合:指模型学习较弱,而数据复杂度较高的情况,此时模型由于学习能力不足,无法学习到数据集中的“一般规律”,因而导致泛化能力弱。
过拟合:值模型学习能力过强的情况中出现,此时的模型学习能力太强,以至于将训练集单个样本自身的特点都能捕捉到,并将其认为是“一般规律”,同样这种情况也会导致模型泛化能力下降。
左图就是一个欠拟合的情况,模型虽然可以预测到随着尺寸的增加房价也跟着递增,但是由于学习能力不足,这不是一个非常好的模型,不能经行准确的预测。
中间图就是一个非常好的模型。
右图就是一个过拟合的情况,模型虽然可以完全拟合数据集中的每个数据,但是可以明显看出这个在预测一个数据集中没有的数据时,就不能做出准确的预测
三、代价函数:
以上图为例,左图中的θ_3与θ_4对图像的影响最大,想要拟合出合适的模型,可以对这两个参数经行惩罚,使两个参数趋于0,这样就可以将这个四次函数视为一个二次函数,呈现出如中间图的情况。但是如果函数特征特别多,便无法预测哪个参数在高阶项中,所以就需要把所有参数都约束住。此时代价函数就编程如下:
需要注意的是,θ的累加从θ_1开始,而不惩罚θ_0的值,因为θ_0受x_0的影响,x_0通常约定熟成的设置为1
四、线性回归正则化
1、梯度下降
修改了代价函数之后,采取梯度下降方法代价函数最小化的方式与之前学的完全相同,只是在后面添加了θ的累加,则需要重新计算偏导数的值,具体偏导数的结果自己计算根据自己的预测的h(x)再计算这里就不放,值得注意的是,由于后面的θ的累加是不需要累加θ_0,θ_0的偏导数是与之前一样的.
repeat until convergence{
(simultaneously update all )
}
2、正规方程
具体公式下图所示,其中后面的对角阵是一个(n+1)*(n+1)的方阵
五、Logistic回归正规化
这里与线性回归的可以说是一样的就不做过多解释直接放公式
repeat until convergence{
(simultaneously update all )
}
机器学习(五)——正规化相关推荐
- 机器学习实战(用Scikit-learn和TensorFlow进行机器学习)(五)
上几节讲述了真实数据集在回归问题以及分类问题上的总流程,但是对于模型的选择及参数的选择仍然一知半解,因此本节开始讲述关于模型的一些知识,本节会略过一些比较基础的知识,将一些较为深入的知识.如果在哪个方 ...
- B.数据挖掘机器学习[五]---汽车交易价格预测详细版本{模型融合(Stacking、Blending、Bagging和Boosting)}
[机器学习入门与实践]入门必看系列,含数据挖掘项目实战:数据融合.特征优化.特征降维.探索性分析等,实战带你掌握机器学习数据挖掘 专栏详细介绍:[机器学习入门与实践]合集入门必看系列,含数据挖掘项目实 ...
- 从零开始学习机器学习五:决策树算法特征工程
决策树&特征工程 目标 1 简介 1.1 认识决策树 2 分类原理 2.1 熵 2.2 决策树的划分依据一-信息增益 2.3 决策树的划分依据二-信息增益率 2.4 决策树的划分依据三-基尼值 ...
- 机器学习(五)决策树(decision tree)
决策树(decision tree)(一)--构造决策树方法 决策树算法起源于E.B.Hunt等人于1966年发表的论文"experiments in Induction",但真正 ...
- 机器学习(五)---贝叶斯分类器算法总结
1. 综述 1.1贝叶斯分类器 贝叶斯决策论是概率框架下实施决策的基本方法.对分类任务来说,在所有概率都已经知道的理想情况下,贝叶斯决策论考虑如何基于这些概率和误判损失来选择最优的类别标记. 具体的说 ...
- 机器学习(五) 关于散点图生成
import numpy as np #随机生成点 from sklearn.datasets import make_blobs#K-means:k均值聚类 cluster(一簇,一类) from ...
- 机器学习(五)——缓解过拟合
看图理解过拟合与欠拟合 欠拟合解决方法 增加输入特征项 增加网络参数 减少正则化参数 过拟合解决方法 数据清洗 增大训练集 采用正则化 增大正则化参数 案例 import tensorflow as ...
- 入门机器学习(五)--正则化
1. 过拟合问题(The Problem of Overfitting) 线性回归的例子: 以下图像是用不同的假设函数来拟合相同的数据集: 拟合结果如下: 第一张图用一阶多项式来拟合,效果不好,不能很 ...
- 吴恩达机器学习(五)逻辑回归练习-二分类练习
1.基础内容 (1)公式总结: (2)内容回归: 逻辑回归主要是进行二分类和多分类. 二分类中,分为线性可分和线性不可分. 对于线性回归模型,我们定义的代价函数是所有模型误差的平方和.理论上来说,我们 ...
- 机器学习(五):深入浅出PCA降维
一.前言 PCA可以说是业界使用的非常频繁的机器学习方法了,今天博主带领大家深入浅出PCA模型,相信看完本文你会对PCA有一个更加深刻的理解.话不多说,请看下文!!! 二.理论介绍 2.1 什么是PC ...
最新文章
- python编程求圆的面积案例_Python实用案例编程入门:第七章 调式手段
- python函数用法详解2(变量的作用域(全局变量、局部变量)、共享全局变量、函数返回值、函数的参数(位置参数、关键字参数、默认参数、不定长参数)、拆包、交换变量值、引用、可变和不可变类型)
- js onclick方法
- rac安装grid报INS-41112错误
- 爱立信和威瑞森电信使用VR流式车来测试5G
- 查看Oracle中存储过程长时间被卡住的原因
- 《AngularJS深度剖析与最佳实践》一2.2 模块
- javaweb学习总结十七(web应用组织结构、web.xml作用以及配置虚拟主机搭建网站)
- python面向对象(2)—— 继承(3)
- mybatis 模糊查询
- Windows环境下QWT安装及配置
- drill apache_Apache Drill:如何创建新功能?
- HTML5中的webSocket、ajax、http
- 你了解node多进程吗
- C++ String封装
- php中result的值,PHP 返回所取得行中字段的值
- spring-aop源码分析
- -离散数学-期末练习题解析
- 网页版查询mysql数据_网页查询数据库 数据库查询
- 微信联盟链接不到服务器怎么,LOL微信登不上去怎么办?微信登不上解决方法推荐...