机器学习算法的效果评估和优化方法
当我们运用训练好了的模型来预测未知数据的时候发现有较大的误差,我们下一步可以做什么?
1.获得更多的训练实例——通常是有效的,但代价较大,下面的方法也可能有效,可考虑先采用下面的几种方法。
2.尝试减少特征的数量
3.尝试获得更多的特征
4.尝试增加多项式特征
5.尝试减少归一化程度λ
6.尝试增加归一化程度λ
我们不应该随机选择上面的某种方法来改进我们的算法,而是运用一些机器学习诊断法来帮助我们知道上面哪些方法对我们的算法是有效的。通常会从以下几个角度入手,差不一定是数据集越大效果越好。
一. 算法的性能评估:
a. 评估假设函数是否过按拟合?
对h(x)作图是一种方法,通常特征量多的时候,作图基本不可能。
把数据分为训练集和测试集7/3分;
b. 模型选择和交叉验证集
假如要在多个不同的二项式模型之间选择,需要引入交叉验证集来辅助选择模型。即训练集/交叉验证集/测试集为6/2/2分。
模型选择的方法为:
1.使用训练集训练出10个模型
2.用10个模型分别对交叉验证集计算得出交叉验证误差(代价函数的值)
3.选取代价函数值最小的模型
4.用步骤3中选出的模型对测试集计算得出推广误差(代价函数的值)
c. 诊断偏差和方差
对于训练集,当d较小时,模型拟合程度更低,误差较大;随着d的增长,拟合程度提高,误差减小。
对于交叉验证集,当d较小时,模型拟合程度低,误差较大;但是随着d的增长,误差呈现先减小后增大的趋势,转折点是我们的模型开始过拟合训练数据集的时候。
如果我们的交叉验证集误差较大,我们如何判断是方差还是偏差呢?
训练集误差和交叉验证集误差近似时:偏差/欠拟合
交叉验证集误差远大于训练集误差时:方差/过拟合
d. 归一化和偏差/方差
回归中为了防止过拟合,引入了lambda。但它的值过大或过小,对结果也会有一定影响。
我们选择一系列的想要测试的λ值,通常是0-10 之间的呈现2倍关系的值(如:0,0.01,0.02,0.04,0.08,0.15,0.32,0.64,1.28,2.56,5.12,10共12个)。
选择λ的方法为:
1.使用训练集训练出12个不同程度归一化的模型
2.用12模型分别对交叉验证集计算的出交叉验证误差
3.选择得出交叉验证误差最小的模型
4.运用步骤3中选出模型对测试集计算得出推广误差,我们也可以同时将训练集和交叉验证集模型的代价函数误差与λ的值绘制在一张图表上:
l 当λ较小时,训练集误差较小(过拟合)而交叉验证集误差较大
l 随着λ的增加,训练集误差不断增加(欠拟合),而交叉验证集误差则是先减小后增加
e. 学习曲线
学习曲线是学习算法的一个很好的合理检验(sanity check)。学习曲线是将训练集误差和交叉验证集误差作为训练集实例数量(m)的函数绘制的图表。
高偏差/欠拟合的情况下,增加数据到训练集不一定能有帮助。
高方差/过拟合的情况下,增加更多数据到训练集可能可以提高算法效果。
二. 总结:
针对本文开头列的几种方法,可以在分析确定发球高偏差不是高方差后再针对性地入手优化。本描述对神经网络也同样适用。
- 尝试获得更多的特征——解决高偏差
- 尝试增加多项式特征——解决高偏差
- 尝试减少归一化程度λ——解决高偏差
- 获得更多的训练实例——解决高方差
- 尝试减少特征的数量——解决高方差
- 尝试增加归一化程度λ——解决高方差
机器学习算法的效果评估和优化方法相关推荐
- 全网最全:机器学习算法模型自动超参数优化方法汇总
什么是超参数? 学习器模型中一般有两类参数,一类是可以从数据中学习估计得到,我们称为参数(Parameter).还有一类参数时无法从数据中估计,只能靠人的经验进行设计指定,我们称为超参数(Hyper ...
- 热门解读:大促的活动设计及效果评估的优化
在零售行业,大促活动在全年整体活动中占据非常重要的地位.零售行业的活动运营分为日常活动运营和节日促销活动运营.日常活动运营,比如限时秒杀.多人拼团购买.猜你喜欢等:节日促销运营,比如元宵节.情人节.妇 ...
- 机器学习-算法背后的理论与优化(part5)--结构风险最小(下)
学习笔记,仅供参考,有错必纠 参考自:机器学习-算法背后的理论和优化: 文章目录 结构风险最小(下) 回归的正则化 L 2 L_2 L
- 机器学习-算法背后的理论与优化(part2)--广义线性模型
学习笔记,仅供参考,有错必纠 参考自:机器学习-算法背后的理论和优化: 广义线性模型 广义线性模型的定义 对于第一个问题,后面的分析中会看到在一定的假设下选择Sigrnoid函数是一种必然. 关于第二 ...
- 机器学习-算法背后的理论与优化(part1)--从线性回归到逻辑回归
学习笔记,仅供参考,有错必纠 参考自:机器学习-算法背后的理论和优化: 从线性回归到逻辑回归 线性回归估算的是一个连续变量的条件期望: E ( y ∣ x ) = w T x (1) E(y|x)=w ...
- 热门解读:社交裂变的拉新效果评估及优化
目前我国零售行业全面数字化已成趋势,数字化力量在驱动零售新发展.重塑零售新增长格局中扮演着越来越重要的角色.对每个零售品牌商来说,微信这一庞大的私域流量池,囊括百万甚至千万的客户.社交裂变已成为品牌商 ...
- 【机器学习】算法模型自动超参数优化方法
什么是超参数? 学习器模型中一般有两类参数,一类是可以从数据中学习估计得到,我们称为参数(Parameter).还有一类参数时无法从数据中估计,只能靠人的经验进行设计指定,我们称为超参数(Hyper ...
- 机器学习实战:模型评估和优化
原文: Real-World Machine Learning: Model Evaluation and Optimization 作者:Henrik Brink, Joseph W. Richar ...
- 机器学习之聚类算法——聚类效果评估可视化
我曾在机器学习之聚类算法应用篇中介绍过,聚类算法常使用轮廓系数来评估聚类效果,不过有时候并不是轮廓系数越大越好,如下面两幅图所示,图中的红色虚线表示聚类系数分数: 显然将簇数据设置为2的时候得到的轮廓 ...
最新文章
- 【Leetcode】刷题的开始
- Linux系统磁盘满了
- 文件夹里面照片自动分成子文件夹_Windows居然自带这个功能,自动整理你硬盘里的照片...
- Python 的and 运算
- UCall能真正的免费打电话,爽
- 翻新电子元器件识别的一些方法技巧
- jquery手机端带农历的万年历插件
- 网站后台扫描工具wwwscan、御剑、dirbuster、cansina的用法
- 文献翻译__基于自适应全变差L1正则化的椒盐图像去噪
- php变形的itf条码,itf14条码生成器 第14章生成器.doc
- PhotoShop - 建立剪切蒙版
- 2015年度APP分类
- Sublime 打开文件中文乱码
- sklearn.metrics.confusion_matrix
- 2023电工杯数学建模竞赛A题思路解析+代码+论文
- 企立方:拼多多直播预热要怎么做
- Ubuntu 日常系列:常用软件
- 显示器的品牌型号和价格计算机,电脑显示器价格?选购电脑显示器注意什么?...
- 你想过吗,为什么说面向对象最符合人的思维?
- repo remote元素中fetch=“.“或者“..“的理解
热门文章
- 弱电计算机机房方案,机房弱电建设方案(主要是安防、布线,无广告).doc
- 只看不敲,神也学不好C---------嵌入式经典书籍经验分享
- 设置NTFS磁盘文件夹的可写权限(转自:http://doc.spacebuilder.cn/Default.aspx?Page=setNTFSAspxAutoDetectCookieSuppor)
- 【非常菜的笔记】MonoBehaviour的单例模式(不能使用new 实例化继承自MonoBehaviour的类)
- 如何停用笔记本的触摸板鼠标touch pad
- 全志A64内核编译一些错误解决方法
- 大神论坛 逆向分析 Internet Download Manager 序列号算法 附IDM注册机完整源码
- 当濒危野生动物开始被昇腾AI保护起来
- 【概率论与数理统计】猴博士 笔记 p17-20 一、二维连续型:已知F,求f;已知f,求f
- 高压功率放大器ATA4014VS高压功率放大器HSA42014