常用机器学习算法包括分类、回归、聚类等几大类型,以下针对不同模型总结其评估指标

一、分类模型

常见的分类模型包括:逻辑回归、决策树、朴素贝叶斯、SVM、神经网络等,模型评估指标包括以下几种:

(1)二分类问题

(a)混淆矩阵

准确率A:预测正确个数占总数的比例

精准率P:正例样本中有多少被预测正确了

召回率R:预测的正例样本中有多少是正确的

F1 Score(精准率与召回率集成):2P*R/(P+R)

(b)ROC曲线:ROC曲线应尽量偏离参考线,越靠近左上越好

(c)AUC:ROC曲线下面积,参考线面积为0.5,AUC应大于0.5,且偏离越多越好

(d)Lift曲线:表示“运用该模型”与“未运用该模型即随机选择”所得结果的比值,Lift应该移植大于1,且Lift(提升指数)越大,模型预测效果越好

(2)多分类问题

评价多分类模型一般采用准确率作为评估指标

二、回归模型

常见的回归模型包括线性回归、多项式回归、Lasso回归、岭回归、弹性网络、SVM、神经网络,评估指标见以下总结

(1)MSE

均方误差,SSE/m,值越小代表拟合效果越好,用来衡量不同模型对于同一数据集的拟合效果

(2)R^2

决定系数,1-SSE/SST,用于度量模型的解释能力,是相关系数的平方,取值范围为0~1,越接近1表示模型参考价值越高,在scikit-learn中LinearRegression.score就是使用的决定系数,也可以使用专门的库metrics.r2_score

(3)修正的R^2

在多元线性回归中,决定系数会虚高,加一个自变量就会增大,加公式进行修正  1-[SSE/(n-p-1)/[SST/(n-1)],得到修正的决定系数

三、聚类模型

常见的聚类模型有KMeans、密度聚类、层次聚类等,主要从簇内的稠密成都和簇间的离散程度来评估聚类的效果,评估指标包括:

(1)轮廓系数 Silhouette Corfficient

轮廓系数由凝聚度和分离度共同构成,组内SSE越小,组间SSB越大,聚类效果越好,轮廓系数在-1~1之间,值越大,聚类效果越好

(2)协方差系数 Calinski-Harabaz Index

类别内部数据协方差越小越好,类别之间协方差越大越好,这样协方差系数会越高。

kmeans及模型评估指标_机器学习模型评估指标总结相关推荐

  1. 机器学习模型定点化_机器学习模型的超参数优化

    引言 模型优化是机器学习算法实现中最困难的挑战之一.机器学习和深度学习理论的所有分支都致力于模型的优化. 机器学习中的超参数优化旨在寻找使得机器学习算法在验证数据集上表现性能最佳的超参数.超参数与一般 ...

  2. 机器学习模型 知乎_机器学习-模型选择与评价

    交叉验证 首先选择模型最简单的方法就是,利用每一种机器学习算法(逻辑回归.SVM.线性回归等)计算训练集的损失值,然后选择其中损失值最小的模型,但是这样是不合理的,因为当训练集不够.特征过多时容易过拟 ...

  3. auuc 评估指标_机器学习性能评估指标汇总

    跑完分类模型(Logistic回归.决策树.神经网络等),我们经常面对一大堆模型评估的报表和指标,如ACC.ROC.AUC等,对以上提到的各个评估指标逐一点评,并力图表明: 指标分类 学习分类 性能指 ...

  4. kmeans及模型评估指标_使用sklearn评估器构建聚类模型

    原标题:使用sklearn评估器构建聚类模型 作者:徐瑶佳 来源:人工智能学习圈 工作内容: 聚类算法是在没有给定划分类别的情况下,根据数据样本的相似度进行样本分组的一种算法.聚类算法过程是无监督的, ...

  5. 评估模型如何建立_建立和评估分类ML模型

    评估模型如何建立 There are different types of problems in machine learning. Some might fall under regression ...

  6. 机器学习模型 非线性模型_机器学习模型说明

    机器学习模型 非线性模型 A Case Study of Shap and pdp using Diabetes dataset 使用糖尿病数据集对Shap和pdp进行案例研究 Explaining ...

  7. 机器学习方法_机器学习模型应用方法综述

    文章发布于公号[数智物语] (ID:decision_engine),关注公号不错过每一篇干货. 来源 | 数据派THU(id:DatapiTHU) 作者:Julien Kervizic 翻译:陈之炎 ...

  8. tensorflow超参数优化_机器学习模型的超参数优化

    引言 模型优化是机器学习算法实现中最困难的挑战之一.机器学习和深度学习理论的所有分支都致力于模型的优化. 机器学习中的超参数优化旨在寻找使得机器学习算法在验证数据集上表现性能最佳的超参数.超参数与一般 ...

  9. 评估指标_机器学习评估方法与评估指标总结

    离线评估方法 离线评估的基本原理是在离线环境中,将数据集划分为"训练集"和"测试集",用"训练集"训练模型,用"测试集" ...

最新文章

  1. HDLBits 系列(37)此系列关于独热码的题目的疑问?
  2. Flutter开发使用PlatformView显示iOS原生View(50)
  3. ubuntu16.04打开软件或终端的窗口自动在左上角
  4. Eclipse vs IDEA快捷键对比大全
  5. IIS部署VUE刷新404问题如何解决?
  6. Docker系列(十)Dockerfile指令
  7. 金蝶k3wise云服务器配置,金蝶K3WISEV15.0系统配置说明
  8. html中字体 楷体_HTML+CSS入门 CSS设置中文字体(font-family:黑体)后样式失效问题如何解决...
  9. flask_uploads——“ImportError: cannot import name ‘secure_filename‘ from ‘werkzeug‘“
  10. [计算机数值分析]开方公式-牛顿法
  11. swift ring
  12. 多目标优化系列(六)SPEA
  13. Java关键字详解this、private、static、super、extends继承、instanceof、final、abstract、interface、implements、enum...
  14. 宽带提速后如何恰如其分的选择路由器?
  15. 用matlab画干涉条纹图,matlab干涉条纹处理
  16. incident用法_incident与_accident区别
  17. 【iframe结合pdf.js实现pdf的预览/下载及打印功能】
  18. 【巨人的肩膀上制造世界】——2——Unity3D实用插件之QHierarchy,更方便的管理你的层级面板,全中文教程!
  19. 深度学习服务器装机指南
  20. 西门子HMI SMART 700 IE 设备概况以及WinCC flexible 2008常用配置小记

热门文章

  1. jQuery键盘输入文字打字动画特效
  2. 2023最新SSM计算机毕业设计选题大全(附源码+LW)之java滁州学院考研信息分享论坛0iaj2
  3. ABLIC推出用于增强汽车设备安全性的S-19516、S-19517和S-19519系列多功能多合一LDO线性稳压器
  4. 2000字长文:探讨报销系统中的数据分析框架设计
  5. cfgym103821 (Aleppo + HAIST + SVU + Private) CPC 2022 解题报告
  6. cf gym/103821 (Aleppo + HAIST + SVU + Private) CPC 2022
  7. stata软件汉化指南
  8. Fedora23下安装Fuji Xeron DocuPrint-M218-fw驱动
  9. 眼睛php是什么手术,眼睛什么情况下要做手术
  10. C++ 编译错误 will be initialized after [-Werror=reorder]