最近做实验要用到性能度量的东西,之前学习过现在重新学习并且实现一下。

衡量模型泛化能力的评价标准,这就是性能度量。性能度量反应了任务需求,在对比不同模型的能力时,使用不同的性能度量往往会导致不同的评判结果;什么样的模型是好的,不仅取决于算法和数据,还决定于任务需求。

一、性能度量方法

1.1错误率与精度

错误率是分类错误的样本数占样本总数的比例,精度是分类正确的样本数占样本总数的比例。

1.2查准率(precision)、查全率(recall)与F1

对于二分类问题,将样例根据其真实类别与预测类别的组合划分为真正例(true positive,TP)、假正例(false positive,FP)、真反例(true negative,TN)、假反例(false negative,FN)。有 (为样本总数)。分类结果的混肴矩阵:

           真实情况                                  预测结果
               正例                反例
                正例                 TP                 FN
                反例                 FP                 TN

查准率与查全率分别定义为

 ,

.

算法对样本进行分类时,都会有置信度,即表示该样本是正样本的概率,比如99%的概率认为样本A是正例,1%的概率认为样本B是正例。通过选择合适的阈值,比如50%,对样本进行划分,概率大于50%的就认为是正例,小于50%的就是负例。

通过置信度就可以对所有样本进行排序,再逐个样本的选择阈值,在该样本之前的都属于正例,该样本之后的都属于负例。每一个样本作为划分阈值时,都可以计算对应的precision和recall,那么就可以以此绘制曲线。那很多书上、博客上给出的P-R曲线,都长这样

平衡点(break-even point,BEP)是查准率=查全率时的取值。基于它可以判断学习器的优劣。

但是BEP还是过于简化,更常用的是F1度量:

F1度量的一般形式,能让我们表达出对查准率/查全率的不同偏好,定义为

其中度量了查全率对查准率的相对重要性。时退化为标准的F1;时查全率有更大的影响;时查准率有更大的影响。

有时候我们有多个二分类混淆矩阵,例如进行多次训练测试;或是在多个数据集上训练测试等,我们希望在n个二分类混淆矩阵上总和考察查准率和查全率。因此有宏F1和微F1。

F1是基于查准率与查全率的调和平均定义的  

则是加权调和平均:

与算术平均()和几何平均()相比,调和平均更重视较小值。

1.2ROC与AUC

ROC全称受试者工作特征(Receiver Operating Characteristic)曲线,ROC曲线的纵轴是真正例率(True Positive Rate,TPR),横轴是假正例率(False Positive Rate,FPR),定义:

AUC(Area Under ROC Curve) :为ROC曲线下的面积和,通过它来判断学习器的性能。AUC考虑的是样本预测的排序质量。

给定个正例和个反例,令分别表示正反例集合,定义排序损失:

即考虑一对正反例,若正例预测值小于反例,记一个罚分,若相等,记0.5个罚分。容易看出对应的是ROC曲线之上的面积。因此有

二、python实现

图均为上节中引用的图片,在此不重复引用。

2.1P-R

from sklearn import svm, datasets
from sklearn.model_selection import train_test_split
import numpy as npiris = datasets.load_iris()
X = iris.data
y = iris.target# Add noisy features
random_state = np.random.RandomState(0)
n_samples, n_features = X.shape
X = np.c_[X, random_state.randn(n_samples, 200 * n_features)]# Limit to the two first classes, and split into training and test
X_train, X_test, y_train, y_test = train_test_split(X[y < 2], y[y < 2],test_size=.5,random_state=random_state)# Create a simple classifier
classifier = svm.LinearSVC(random_state=random_state)
classifier.fit(X_train, y_train)
y_score = classifier.decision_function(X_test)from sklearn.metrics import precision_recall_curve
import matplotlib.pyplot as pltprecision, recall, _ = precision_recall_curve(y_test, y_score)plt.step(recall, precision, color='b', alpha=0.2,where='post')
plt.fill_between(recall, precision, step='post', alpha=0.2,color='b')plt.xlabel('Recall')
plt.ylabel('Precision')
plt.ylim([0.0, 1.05])
plt.xlim([0.0, 1.0])
plt.title('2-class Precision-Recall curve: AP={0:0.2f}'.format(average_precision))

2.2ROC

import numpy as np
import matplotlib.pyplot as plt
from itertools import cyclefrom sklearn import svm, datasets
from sklearn.metrics import roc_curve, auc
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import label_binarize
from sklearn.multiclass import OneVsRestClassifier
from scipy import interp# Import some data to play with
iris = datasets.load_iris()
X = iris.data
y = iris.target# Binarize the output
y = label_binarize(y, classes=[0, 1, 2])
n_classes = y.shape[1]# Add noisy features to make the problem harder
random_state = np.random.RandomState(0)
n_samples, n_features = X.shape
X = np.c_[X, random_state.randn(n_samples, 200 * n_features)]# shuffle and split training and test sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.5,random_state=0)# Learn to predict each class against the other
classifier = OneVsRestClassifier(svm.SVC(kernel='linear', probability=True,random_state=random_state))
y_score = classifier.fit(X_train, y_train).decision_function(X_test)# Compute ROC curve and ROC area for each class
fpr = dict()
tpr = dict()
roc_auc = dict()
for i in range(n_classes):fpr[i], tpr[i], _ = roc_curve(y_test[:, i], y_score[:, i])roc_auc[i] = auc(fpr[i], tpr[i])# Compute micro-average ROC curve and ROC area
fpr["micro"], tpr["micro"], _ = roc_curve(y_test.ravel(), y_score.ravel())
roc_auc["micro"] = auc(fpr["micro"], tpr["micro"])plt.figure()
lw = 2
plt.plot(fpr[2], tpr[2], color='darkorange',lw=lw, label='ROC curve (area = %0.2f)' % roc_auc[2])
plt.plot([0, 1], [0, 1], color='navy', lw=lw, linestyle='--')
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.05])
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.title('Receiver operating characteristic example')
plt.legend(loc="lower right")
plt.show()

机器学习性能度量(2):错误接受率 (FAR), 错误拒绝率(FRR),EER计算方法,python实现

https://blog.csdn.net/qq_18888869/article/details/84942224

机器学习性能度量(1):P-R曲线与ROC曲线,python sklearn实现相关推荐

  1. 机器学习之性能度量指标——决定系数R^2、PR曲线、ROC曲线、AUC值、以及准确率、查全率、召回率、f1_score

    一.线性回归的决定系数(也称为判定系数,拟合优度) 相关系数是R哈~~~就是决定系数的开方! 正如题所说决定系数是来衡量回归的好坏,换句话说就是回归拟合的曲线它的拟合优度!也就是得分啦~~ 决定系数它 ...

  2. 机器学习模型性能评估(二):P-R曲线和ROC曲线

    上文简要介绍了机器学习模型性能评估的四种方法以及应用场景,并详细介绍了错误率与精度的性能评估方法.本文承接上文,继续介绍模型性能评估方法:P-R曲线和ROC曲线.                   ...

  3. 机器学习中的性能指标:精度、召回率,PR曲线,ROC曲线和AUC,及示例代码

    机器学习中的性能指标:精度.召回率.PR曲线,ROC曲线和AUC 精度.召回率 基本概念 F-Score 度量曲线 PR曲线 ROC曲线 PR曲线和ROC曲线的比较 AUC 精度.召回率 基本概念 可 ...

  4. 机器学习:关于P-R曲线和Roc曲线

    一:关于P-R曲线:     1:1:何为P-R曲线: P为precision即精准率(查准率),R为recall即召回率,所以P-R曲线是反映了准确率与召回率之间的关系.一般横坐标为recall,纵 ...

  5. 百面机器学习 #2 模型评估:0102 精确率与召回率,假阳性与真阳性率,PR曲线和ROC曲线

    文章目录 1. P-R(Precision-Recall)曲线 F1 score 2. 平方根误差的局限性 3. ROC曲线 ROC曲线绘制 4. AUC predict Positive predi ...

  6. Sklearn机器学习——ROC曲线、ROC曲线的绘制和AUC面积、运用ROC曲线找到最佳阈值

    目录 1 ROC曲线 2 ROC曲线的绘制 2.1 Sklearn中的ROC曲线和AUC面积 2.2 利用ROC曲线找到最佳阈值 1 ROC曲线 上篇博客介绍了ROC曲线的概率和阈值还有SVM实现概率 ...

  7. 机器学习:何为PR曲线与ROC曲线

    PR曲线实则是以precision(精准率)和recall(召回率)这两个为变量而做出的曲线,其中recall为横坐标,precision为纵坐标. 想要明白何为precision(精准率)和reca ...

  8. 机器学习笔记(一)P-R曲线与ROC曲线

    P-R曲线与ROC曲线 一.什么是P-R曲线? 二.什么是ROC曲线? 三.P-R曲线与ROC曲线有什么用? 三.绘制P-R曲线代码 一.什么是P-R曲线? 要知道什么是P-R曲线,首先,我们要先了解 ...

  9. 机器学习:python绘制P-R曲线与ROC曲线

    Python绘制P-R曲线与ROC曲线 查准率与查全率 P-R曲线的绘制 ROC曲线的绘制 查准率与查全率   P-R曲线,就是查准率(precision)与查全率(recall)的曲线,以查准率作为 ...

最新文章

  1. 软件测试技术学什么条件,软件测试从业者需要具备哪些技能
  2. 开发日记-20190614 克服过去
  3. 9.10 css
  4. import pymysql 没有模块_小白详细的 python 模块的运用
  5. Intel3945ABG无线上网问题总结
  6. java代码整合_java合并多个文件的实例代码
  7. TensorFlow 简介
  8. 当60亿次攻击来袭,人机联合打了一场漂亮的防御战
  9. 收集一些常用的CDN链接!无需下载快速使用!
  10. HTML的语义化和一些简单优化
  11. VHDL计算机硬件能直接执行吗,第5章 VHDL程序结构.ppt
  12. I.MX6 Android shutdown shell command
  13. 智能车图像处理7-车库的判断
  14. 必须了解的一些IT知识点
  15. python PIL 图像增强
  16. 【建站笔记】:在wordpress博客文章中插入代码段并高亮显示
  17. 数据科学竞赛经验分享:你从未见过的究极进化秘笈
  18. 移动的项目,在tunnel为888696的情况下创建业务
  19. 软件测试工资一般多少 即使测试刚入行,起步月薪也会在8k-9k
  20. 【ThreeJs】(2)照相机 | 正交投影照相机 | 透视投影照相机

热门文章

  1. 深入探究VC —— 链接器link.exe(4)【转】http://blog.csdn.net/wangningyu/article/details/4849452...
  2. 深入delphi编程(转)
  3. 递归用函数、存储过程实现的效果
  4. linux+eth0+流量监控,linux流量监控脚本 | 旺旺知识库
  5. pfamscan 的使用_Hmmer安装与使用
  6. mac好用大java_2020 最后,搞个 Mac 玩玩
  7. powerbi的功能介绍_PowerBI 8月更新,这几个实用功能,你应该会用到
  8. arraylist 线程安全_数据结构之Array、ArrayList、List、LinkedList对比分析
  9. 前端判断数据类型的通用方法
  10. SLAM: Orb_SLAM中的ORB特征