kmeans及模型评估指标_机器学习模型评估指标总结

常用机器学习算法包括分类、回归、聚类等几大类型，以下针对不同模型总结其评估指标

一、分类模型

常见的分类模型包括：逻辑回归、决策树、朴素贝叶斯、SVM、神经网络等，模型评估指标包括以下几种：

(1)二分类问题

(a)混淆矩阵

准确率A：预测正确个数占总数的比例

精准率P：正例样本中有多少被预测正确了

召回率R：预测的正例样本中有多少是正确的

F1 Score(精准率与召回率集成)：2P*R/(P+R)

(b)ROC曲线：ROC曲线应尽量偏离参考线，越靠近左上越好

(c)AUC：ROC曲线下面积，参考线面积为0.5，AUC应大于0.5，且偏离越多越好

(d)Lift曲线：表示“运用该模型”与“未运用该模型即随机选择”所得结果的比值，Lift应该移植大于1，且Lift(提升指数)越大，模型预测效果越好

(2)多分类问题

评价多分类模型一般采用准确率作为评估指标

二、回归模型

常见的回归模型包括线性回归、多项式回归、Lasso回归、岭回归、弹性网络、SVM、神经网络，评估指标见以下总结

(1)MSE

均方误差，SSE/m，值越小代表拟合效果越好，用来衡量不同模型对于同一数据集的拟合效果

(2)R^2

决定系数，1-SSE/SST，用于度量模型的解释能力，是相关系数的平方，取值范围为0~1，越接近1表示模型参考价值越高，在scikit-learn中LinearRegression.score就是使用的决定系数，也可以使用专门的库metrics.r2_score

(3)修正的R^2

在多元线性回归中，决定系数会虚高，加一个自变量就会增大，加公式进行修正 1-[SSE/(n-p-1)/[SST/(n-1)]，得到修正的决定系数

三、聚类模型

常见的聚类模型有KMeans、密度聚类、层次聚类等，主要从簇内的稠密成都和簇间的离散程度来评估聚类的效果，评估指标包括：

(1)轮廓系数 Silhouette Corfficient

轮廓系数由凝聚度和分离度共同构成，组内SSE越小，组间SSB越大，聚类效果越好，轮廓系数在-1~1之间，值越大，聚类效果越好

(2)协方差系数 Calinski-Harabaz Index

类别内部数据协方差越小越好，类别之间协方差越大越好，这样协方差系数会越高。

kmeans及模型评估指标_机器学习模型评估指标总结相关推荐

机器学习模型定点化_机器学习模型的超参数优化
引言模型优化是机器学习算法实现中最困难的挑战之一.机器学习和深度学习理论的所有分支都致力于模型的优化. 机器学习中的超参数优化旨在寻找使得机器学习算法在验证数据集上表现性能最佳的超参数.超参数与一般 ...
机器学习模型知乎_机器学习-模型选择与评价
交叉验证首先选择模型最简单的方法就是,利用每一种机器学习算法(逻辑回归.SVM.线性回归等)计算训练集的损失值,然后选择其中损失值最小的模型,但是这样是不合理的,因为当训练集不够.特征过多时容易过拟 ...
auuc 评估指标_机器学习性能评估指标汇总
跑完分类模型(Logistic回归.决策树.神经网络等),我们经常面对一大堆模型评估的报表和指标,如ACC.ROC.AUC等,对以上提到的各个评估指标逐一点评,并力图表明: 指标分类学习分类性能指 ...
kmeans及模型评估指标_使用sklearn评估器构建聚类模型
原标题:使用sklearn评估器构建聚类模型作者:徐瑶佳来源:人工智能学习圈工作内容: 聚类算法是在没有给定划分类别的情况下,根据数据样本的相似度进行样本分组的一种算法.聚类算法过程是无监督的, ...
评估模型如何建立_建立和评估分类ML模型
评估模型如何建立 There are different types of problems in machine learning. Some might fall under regression ...
机器学习模型非线性模型_机器学习模型说明
机器学习模型非线性模型 A Case Study of Shap and pdp using Diabetes dataset 使用糖尿病数据集对Shap和pdp进行案例研究 Explaining ...
机器学习方法_机器学习模型应用方法综述
文章发布于公号[数智物语] (ID:decision_engine),关注公号不错过每一篇干货. 来源 | 数据派THU(id:DatapiTHU) 作者:Julien Kervizic 翻译:陈之炎 ...
tensorflow超参数优化_机器学习模型的超参数优化
引言模型优化是机器学习算法实现中最困难的挑战之一.机器学习和深度学习理论的所有分支都致力于模型的优化. 机器学习中的超参数优化旨在寻找使得机器学习算法在验证数据集上表现性能最佳的超参数.超参数与一般 ...
评估指标_机器学习评估方法与评估指标总结
离线评估方法离线评估的基本原理是在离线环境中,将数据集划分为"训练集"和"测试集",用"训练集"训练模型,用"测试集" ...

kmeans及模型评估指标_机器学习模型评估指标总结

kmeans及模型评估指标_机器学习模型评估指标总结相关推荐

最新文章

热门文章