[机器学习]机器学习常用的模型评估方法
目录
混淆矩阵
正确率
精确率
召回率
灵敏度
伪阳性率
特异度
P-R曲线:
F1-值
ROC曲线
AUC面积
均方误差
均方根误差
平均绝对误差
混淆矩阵
实际值\预测值 |
预测值 |
||
Positive |
Negative |
||
实际值 |
Positive |
TP |
FN |
Negative |
FP |
TN |
TP: 真阳性,即实际为阳性,预测为阳性
FP:假阳性,即实际为阴性,预测为阳性
FN: 假阴性,即实际为阳性,预测为阴性
TN: 真阴性,即实际为阴性,预测为阴性
在信息检索领域,精确率和召回率又被称为查准率和查全率:
查准率=检索出的相关信息量/检索出的信息总量
查全率=检索出的相关信息量/系统中的相关信息总量
正确率
正确率(Accuracy)又叫准确率,反映一个模型能够预测正确的程度。当数据十分不平衡的时候,将会把所有结果预测为某一类,如样本阳性:阴性为100000:1时,可能预测为阳性的概率非常高。
精确率
精准率(precision)又叫查准率、精准率、精度:是针对我们预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本。
召回率
召回率(Recall)又叫查全率:是针对我们原来的样本而言的,它表示的是样本中的正例有多少被预测正确了。
灵敏度
灵敏度(Sensitivity)真阳性率、命中率 (hit rate):预测为阳性中占实际为阳性比重,和召回率同一个计算方式。值越高,说明漏掉阳性的比例越低,但是有可能出现假阳性。
伪阳性率
伪阳性率(FPR, false positive rate) 又称错误命中率,假警报率 (false alarm rate),即假阳性站实际阴性的比重。
特异度
特异度(Specificity)也称真阴性率:预测为阴性中占实际为阴性比重。值越高,说明漏掉阴性的比例越低,但是有可能出现假阴性。
P-R曲线:
即精确率-召回率曲线。横坐标为召回率Recall,纵坐标为精准率Precision。
P-R曲线反映查准率和查全率之间的关系,查准率和查全率是一对矛盾的度量,一般来说,查准率高时,查全率往往偏低,查全率高时,查准率往往偏低。
当用该指标衡量模型好坏时,在多个P-R曲线比较中,在该图中有两个指标值能说明该指标的差异:
(1)一个学习器的P-R曲线被另一个学习器的P-R曲线完全包住,则可断言后者的性能优于前者
(2)查准率=查全率时的取值,如果这个值较大,则说明学习器的性能较好
F1-值
F1-值(F1-Measure)也称F1-Sore,是精准率和召回率的调和平均数。用于衡量模型的健壮性,实际中如果对业务不是太熟悉,一般把取该值的最大值作为模型的最好状态。
ROC曲线
接收者操作特征曲线(receiver operating characteristic curve),是反映敏感性和伪阳性率连续变量的综合指标,将伪阳性率(FPR)定义为 X 轴,真阳性率(TPR)定义为 Y 轴。
从 (0, 0) 到 (1,1) 的对角线将ROC空间划分为左上/右下两个区域,在这条线的以上的点代表了一个好的分类结果(胜过随机分类),而在这条线以下的点代表了差的分类结果(劣于随机分类)。
完美的预测是在左上角的点,在ROC空间座标 (0,1)点,X=0 代表着没有伪阳性,Y=1 代表着没有伪阴性(所有的阳性都是真阳性);也就是说,不管分类器输出结果是阳性或阴性,都是100%正确。
AUC面积
AUC(Area under curve)即ROC曲线下的面积,是一个模型评价的指标,只能用于二分类模型的评价。 ROC曲线的横轴是FPR,纵轴是TPR,当二者相等时,即y=x,表示的意义是:对于不论真实类别是阳性还是阴性的样本,分类器预测为阳性的概率是相等的,实际上该模型没有任何意义。实际训练模型中应该使TPR尽量大,FPR尽量小,即取AUC的极大值。
均方误差
均方误差(MSE)又称为二次损失,L2损失(Mean Square Error, Quadratic Loss, L2 Loss),是最常用的回归损失函数,用于衡量回归模型,值越小,证明模型越好。损失函数是衡量预测模型预测期望结果表现的指标。寻找函数最小值。
均方根误差
均方根误差即RMSE(Root Mean Square Error),均方误差(MSE)的平方根。
平均绝对误差
平均绝对误差又称为L1损失(Mean Absolute Error, L1 Loss),平均绝对误差(MAE)是另一种用于回归模型的损失函数。MAE是目标变量和预测变量之间差异绝对值之和。因此,它在一组预测中衡量误差的平均大小,而不考虑误差的方向。
MSE与MAE差异:MSE越大,如果数据有某些点离数据中心很远,MSE增长得就很快。直观来说,对观测数据,如果我们只给一个预测结果来最小化MSE,那么该预测值是所有目标值的均值。但是如果我们试图最小化MAE,那么这个预测就是所有目标值的中位数。中位数对于离群点比平均值更鲁棒,这使得MAE比MSE更加鲁棒。
在实际业务中,如果离群点是会影响业务、而且是应该被检测到的异常值,那么我们应该使用MSE。另一方面,如果我们认为离群点仅仅代表数据损坏,那么我们应该选择MAE作为损失。
[机器学习]机器学习常用的模型评估方法相关推荐
- [机器学习]模型评估方法
[机器学习]模型评估方法 评估方法 留出法 交叉验证法 留一法 自助法 评估方法 当进行模型选择时,理想方案是对候选模型的泛化误差进行评估,选择泛化误差最小的模型.但我们却无法直接获得泛化误差,而训练 ...
- 机器学习 基本概念,常用经典模型
1. 机器学习 明白一些基本概念 什么是机器学习 研究如何通过计算的手段,利用经验来改善系统自身的性能 通俗来讲,让代码学着干活 特征:自变量 标签:因变量 学习的种类 有监督学习:提供标签,分类.回 ...
- 机器学习(五)常用分类模型(K最近邻、朴素贝叶斯、决策树)和分类评价指标
机器学习(五)常用分类模型(K最近邻.朴素贝叶斯.决策树)和分类评价指标 文章目录 机器学习(五)常用分类模型(K最近邻.朴素贝叶斯.决策树)和分类评价指标 综述 常用分类模型 K最近邻模型 朴素贝叶 ...
- 机器学习之模型评估方法总结
文章目录 一.分类模型评估指标 1.混淆矩阵(confusion matrix) 2.ROC 3.AUC 二.回归模型评估指标 1.SSE(和方差) 2.MSE(均方差) 3.RMSE(均方根.标准差 ...
- 图解机器学习算法(6) | 决策树模型详解(机器学习通关指南·完结)
作者:韩信子@ShowMeAI 教程地址:https://www.showmeai.tech/tutorials/34 本文地址:https://www.showmeai.tech/article-d ...
- 深入理解机器学习——机器学习模型的性能度量
分类目录:<深入理解机器学习>总目录 对学习器的泛化性能进行评估,不仅需要有效可行的实验估计方法,还需要有衡量模型泛化能力的评价标准,这就是性能度量(Performance Measure ...
- 机器学习算法常用指标总结
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 机器学习性能评价标准是模型优化的前提,在设计机器学习算法过程中,不 ...
- AI:人工智能概念之机器学习中常用算法的思维导图集合(非常经典、建议收藏)之详细攻略
AI:人工智能概念之机器学习中常用算法的思维导图集合(非常经典.建议收藏)之详细攻略 目录 机器学习算法的思维导图集合 1.ML算法思维图 2.ML算法思维导图 相关文章:ML/DL:关于算法模型的选 ...
- 机器学习之常用优化方法(GD、牛顿、拟牛顿、拉格朗日乘子)
写在前面,本文只记录了个人认为的关键点,仅供参考.更多细节请参考链接中文章 参考1:机器学习之常用优化方法 参考2:拉格朗日乘数法 梯度下降法 梯度下降法是最早最简单,也是最为常用的最优化方法.梯度下 ...
最新文章
- Extjs4.2+webAPI+EF实现分页以及webapi的数据传值
- 02day-webpack
- python代码转换为pytorch_pytorch实现Tensor变量之间的转换
- python学习笔记四一列表元组字典等
- python如何读取tfrecord_tensorflow读取tfrecords格式文件
- linux 驱动基础知识(2)---设备树
- Java 多并发之原子访问(Atomic Access)
- SQL插入数据-insert用法
- Matlab中批读取DCM文件
- vb视屏教程计算机二级b,计算机二级vb教程|二级vb视频教程|计算机二级视频教程|快速通过计算机二级VB|猎豹网校视频...
- linux daemontools 安装
- 软件工程基础知识--系统测试
- 用Python3对QQ导出的文本聊天记录进行整理。
- 中国物流市场趋势报告、技术动态创新及市场预测
- 原生实现点击li变颜色
- java set list map_Java中的Set,List,Map
- 欧美插画系列-张聪-专题视频课程
- 算法——猴子分桃问题
- 逻辑树与视觉树基本概念
- 《网络是怎样连接的》读书笔记
热门文章
- UT源码105032014052
- java 多线程操作List,已经做了同步synchronized,还会有ConcurrentModificationException,知道为什么吗?...
- Ajax Loader 图标
- Redisbook学习笔记(3)数据类型之列表
- python 路径的操作
- 20160130001 冯仑风马牛
- Java Server Faces (JSF)页面转换与验证(二)
- 内存越界访问保护 内存泄漏研究 未完待续
- CCNA培训课总结笔记--RIP的基本配置(五)
- TCP协议的缺陷及其可选替代方案