【Python学习】 - sklearn学习 - 评估指标precision

函数声明：

precision_score(y_true, y_pred, labels=None, pos_label=1, average='binary', sample_weight=None)

其中较为常用的参数解释如下：

y_true：真实标签

y_pred：预测标签

average：评价值的平均值的计算方式。可以接收[None, 'binary' (default), 'micro', 'macro', 'samples', 'weighted']对于多类/多标签目标需要此参数。下面进行详细说明：

如果是None，则返回每个类的分数。否则，这决定了对数据进行平均的类型用下面几种统计方法的哪一种：

先说对于'micro' ：

这两种写法是等价的

print(precision_score(y_test, y_pred,average='micro'))
print(np.sum(y_test == y_pred) / len(y_test))

以下内容中，P表示二分类时精确率的计算结果部分内容参考

' macro ' ：相当于类间不带权重。不考虑类别数量，不适用于类别不均衡的数据集，其计算方式为：各类别的P求和/类别数量

' weighted ' : 相当于类间带权重。各类别的P × 该类别的样本数量（实际值而非预测值）/ 样本总数量

举个例子：

如实际样本中，0类有98个样本，1类有2个样本，3类有100个样本,共有3类，样本总数为20。

预测结果中，0类全部预测为3类，全部错误；1类全部预测正确；3类全部预测为0类，全部预测错误。

则P_macro = 0 + 1 + 0 / 3 = 0.33333333

P_weighted = 0×98 + 1×2 + 0×100 / 200 = 2/200 = 0.01

再举个例子：

如共有100个样本，0类98个，1类2个；

预测结果为全0

则P_macro = 0.98 + 0 / 2 = 0.49

P_weighted = 98×0.98 + 0×2 / 100 = 2/200 = 0.9604

得出结论：

对于类别不均衡的分类模型，采用macro方式会有较大的偏差，采用weighted方式则可较好反映模型的优劣，因为若类别数量较小则存在蒙对或蒙错的概率，其结果不能真实反映模型优劣，需要较大的样本数量才可计算较为准确的评价值，通过将样本数量作为权重，可理解为评价值的置信度，数量越多，其评价值越可信。

官方说明：average : string, [None, 'binary' (default), 'micro', 'macro', 'samples', \'weighted']This parameter is required for multiclass/multilabel targets.If ``None``, the scores for each class are returned. Otherwise, thisdetermines the type of averaging performed on the data:``'binary'``:Only report results for the class specified by ``pos_label``.This is applicable only if targets (``y_{true,pred}``) are binary.``'micro'``:Calculate metrics globally by counting the total true positives,false negatives and false positives.``'macro'``:Calculate metrics for each label, and find their unweightedmean.  This does not take label imbalance into account.``'weighted'``:Calculate metrics for each label, and find their average weightedby support (the number of true instances for each label). Thisalters 'macro' to account for label imbalance; it can result in anF-score that is not between precision and recall.``'samples'``:Calculate metrics for each instance, and find their average (onlymeaningful for multilabel classification where this differs from:func:`accuracy_score`).

再给个链接给予参考：https://www.cnblogs.com/harvey888/p/6964741.html

【Python学习】 - sklearn学习 - 评估指标precision_score的参数说明相关推荐

如何绘制深度学习-目标检测评估指标P-R（precision-recall）曲线？如何计算AP（average-precision）？
参考文章:深度学习-目标检测评估指标P-R曲线.AP.mAP 文章目录 P-R曲线: AP计算: 下面通过具体例子说明. 首先用训练好的模型得到所有测试样本的confidence score,每一类( ...
【深度学习】——模型评估指标MAP计算实例计算
目录一.知识储备 1.IOU--交集面积与并集面积之比 2.混淆矩阵(TP.FP.FN.TN) 问题1:上面的TP等具体是如何计算得到的? 3.精度precision&召回率recall 二 ...
深度学习各场景评估指标总结
下表总结了机器学习在常见场景下使用的评估指标: (PS:原文档包含截图,已上传到个人资源) 类别场景场景描述应用场景指标说明图像图像分类识别一张图中是否是某类物体/状态/场景,适用于图 ...
sklearn预测评估指标：混淆矩阵计算详解-附Python计算代码
目录前言混淆矩阵 python代码前言很多时候需要对自己模型进行性能评估,对于一些理论上面的知识我想基本不用说明太多,关于校验模型准确度的指标主要有混淆矩阵.准确率.精确率.召回率.F1 sc ...
python之sklearn学习笔记
sklearn介绍 scikit-learn是数据挖掘与分析的简单而有效的工具. 依赖于NumPy, SciPy和matplotlib. 它主要包含以下几部分内容: 从功能来分: classifica ...
深度学习-目标检测评估指标P-R曲线、AP、mAP
基本概念 P-R曲线中,P为图中precision,即精准度,R为图中recall,即召回率. Example 下面通过具体例子说明. 首先用训练好的模型得到所有测试样本的confidence sc ...
sklearn预测评估指标计算详解：准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1score
目录前言一.准确率二.精确率三.召回率四.F1-score
机器学习Sklearn学习总结
Sklearn学习资料推荐: sklearn中文文档机器学习入门必看:使用 scikit-learn 构建模型的通用模板机器学习神器Scikit-Learn保姆教程! python机器学习_FF_ ...
sklearn多分类准确率评估分类评估分类报告评估指标案例
20211101 深思熟虑之后,研究团队确定了两种评估尺度:价格下降查全率(PDR)和预定反悔率(BR).我们曾统计过,某间房间是否在某天被预定出去,以及预定的价格是多少.PDR和BR都能反映出这一点 ...

【Python学习】 - sklearn学习 - 评估指标precision_score的参数说明

函数声明：

【Python学习】 - sklearn学习 - 评估指标precision_score的参数说明相关推荐

最新文章

热门文章