sklearn.metrics.roc_curve()

首先,需要使用sklearn.metrics.roc_curve()函数
sklearn.metrics.roc_curve(y_true, y_score, pos_label=None, sample_weight=None, drop_intermediate=True)
参数:
y_true : 数组,shape = [样本数]

在范围{0,1}或{-1,1}中真正的二进制标签。如果标签不是二进制的(多分类)则应该显式地给出pos_label

y_score : 数组, shape = [样本数]

目标得分,可以是积极类的概率估计(model.predict_proba(testdata)[:,1]),信心值,或者是决定的非阈值度量(在某些分类器上由“decision_function”返回)。

pos_label:int or str, 标签被认为是积极的,其他的被认为是消极的。

sample_weight: 顾名思义,样本的权重,可选择的

drop_intermediate: boolean, optional (default=True)

是否放弃一些不出现在绘制的ROC曲线上的次优阈值。这有助于创建更轻的ROC曲线

返回值:
注意:返回的三个数组的长度与y_score不同,具体长度怎么控制目前俺还没整明白。
fpr : array, shape = [>2]
根据thresholdsy_score得到的fpr数组

tpr : array, shape = [>2]
根据thresholdsy_score得到的tpr数组
thresholds : array, shape = [n_thresholds] ,选择的阈值数组,按照降序排列。

多分类标签须知:
使用函数label_binarize()得到的标签是一个n✖m的矩阵,n是样本的个数,m是标签类别个数。
比如三分类:

y = label_binarize(y, classes=[0, 1, 2])
array([[1, 0, 0],[0, 1, 0],[1, 0, 0],[0, 1, 0],[0, 0, 1]])

表示第1,3个样本为第一类,第2,4个样本为第二类,第5个样本为第三类。

多分类 FPR TPR 计算:
下图是多分类的混淆矩阵

TP:真正例
FP:假正例
FN:假反例
TN:真反例

对于某一类,TP只是对角线上的一块儿,FN是该类别行上除了对角线元素的部分,FP是该类别列上除了对角线元素的部分,TN是其余的部分,只要是其他类的,不管在不在该类的行和列上,都是TN。

import numpy as np
from sklearn.metrics import confusion_matrixy_true = [1, -1,  0,  0,  1, -1,  1,  0, -1,  0,  1, -1,  1,  0,  0, -1,  0]
y_prediction = [-1, -1,  1,  0,  0,  0,  0, -1,  1, -1,  1,  1,  0,  0,  1,  1, -1]
cnf_matrix = confusion_matrix(y_true, y_prediction)
print(cnf_matrix)
#[[1 1 3]
# [3 2 2]
# [1 3 1]]FP = cnf_matrix.sum(axis=0) - np.diag(cnf_matrix)
FN = cnf_matrix.sum(axis=1) - np.diag(cnf_matrix)
TP = np.diag(cnf_matrix)
TN = cnf_matrix.sum() - (FP + FN + TP)FP = FP.astype(float)
FN = FN.astype(float)
TP = TP.astype(float)
TN = TN.astype(float)# Sensitivity, hit rate, recall, or true positive rate
TPR = TP/(TP+FN)
# Specificity or true negative rate
TNR = TN/(TN+FP)
# Precision or positive predictive value
PPV = TP/(TP+FP)
# Negative predictive value
NPV = TN/(TN+FN)
# Fall out or false positive rate
FPR = FP/(FP+TN)
# False negative rate
FNR = FN/(TP+FN)
# False discovery rate
FDR = FP/(TP+FP)
# Overall accuracy
ACC = (TP+TN)/(TP+FP+FN+TN)

**例子:**
**导包:**```python
import pyupset as pyu
from pickle import load
import os
os.chdir('D:\\train')
import numpy as np
import matplotlib.pyplot as plt
from itertools import cyclefrom sklearn import svm, datasets
from sklearn.metrics import roc_curve, auc
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import label_binarize
from sklearn.multiclass import OneVsRestClassifier
from scipy import interp

导数据:

iris = datasets.load_iris()
X = iris.data
y = iris.target# Binarize the output
y = label_binarize(y, classes=[0, 1, 2])
n_classes = y.shape[1]

建立模型

# Add noisy features to make the problem harder
random_state = np.random.RandomState(0)
n_samples, n_features = X.shape
X = np.c_[X, random_state.randn(n_samples, 200 * n_features)]# shuffle and split training and test sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.5,random_state=0)# Learn to predict each class against the other
classifier = OneVsRestClassifier(svm.SVC(kernel='linear', probability=True,random_state=random_state))
y_score = classifier.fit(X_train, y_train).decision_function(X_test)

重点: 计算每个样本的ROC

# Compute ROC curve and ROC area for each class
fpr = dict()
tpr = dict()
roc_auc = dict()
for i in range(n_classes):fpr[i], tpr[i], _ = roc_curve(y_test[:, i], y_score[:, i])roc_auc[i] = auc(fpr[i], tpr[i])# Compute micro-average ROC curve and ROC area
fpr["micro"], tpr["micro"], _ = roc_curve(y_test.ravel(), y_score.ravel())
roc_auc["micro"] = auc(fpr["micro"], tpr["micro"])

画图:

# Compute macro-average ROC curve and ROC area# First aggregate all false positive rates
all_fpr = np.unique(np.concatenate([fpr[i] for i in range(n_classes)]))# Then interpolate all ROC curves at this points
mean_tpr = np.zeros_like(all_fpr)
for i in range(n_classes):mean_tpr += interp(all_fpr, fpr[i], tpr[i])# Finally average it and compute AUC
mean_tpr /= n_classesfpr["macro"] = all_fpr
tpr["macro"] = mean_tpr
roc_auc["macro"] = auc(fpr["macro"], tpr["macro"])# Plot all ROC curves
plt.figure()
plt.plot(fpr["micro"], tpr["micro"],label='micro-average ROC curve (area = {0:0.2f})'''.format(roc_auc["micro"]),color='deeppink', linestyle=':', linewidth=4)plt.plot(fpr["macro"], tpr["macro"],label='macro-average ROC curve (area = {0:0.2f})'''.format(roc_auc["macro"]),color='navy', linestyle=':', linewidth=4)colors = cycle(['aqua', 'darkorange', 'cornflowerblue'])
for i, color in zip(range(n_classes), colors):plt.plot(fpr[i], tpr[i], color=color, lw=lw,label='ROC curve of class {0} (area = {1:0.2f})'''.format(i, roc_auc[i]))plt.plot([0, 1], [0, 1], 'k--', lw=lw)
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.05])
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.title('Some extension of Receiver operating characteristic to multi-class')
plt.legend(loc="lower right")
plt.show()


此处参考传送门

多分类TPR, FPR, ROC计算与画图相关推荐

  1. 逻辑回归模型混淆矩阵评价与ROC曲线最佳阈值的好处(附Accuracy,TPR,FPR计算函数)

    一.得到阈值在0.5和0.8下模型的混淆矩阵 y_prob=result.predict(X_test)#得到概率值y_predict1=pd.DataFrame(y_prob>0.5).ast ...

  2. ROC受试曲线AUC[TPR/ FPR/截断点/StratifiedKFold/KFold]

    概念 ROC和AUC定义 ROC全称是"受试者工作特征"(Receiver Operating Characteristic).ROC曲线的面积就是AUC(Area Under t ...

  3. 模型评估指标 -1- 基础篇 -FPR/TPR/F1/ROC/AUC

    导语:本文是模型评估指标系列的第一篇,将详细地介绍分类模型中基于混淆矩阵衍生出来的各个指标的计算公式,如准确率,精确率,召回率,FPR,TPR,ROC曲线的绘制逻辑,AUC的计算公式等.本文首发在个人 ...

  4. ​多分类下的ROC曲线和AUC​

    本文主要介绍一下多分类下的ROC曲线绘制和AUC计算,并以鸢尾花数据为例,简单用python进行一下说明.如果对ROC和AUC二分类下的概念不是很了解,可以先参考下这篇文章:机器学习之分类器性能指标之 ...

  5. 多分类下的ROC曲线和AUC

    本文主要介绍一下多分类下的ROC曲线绘制和AUC计算,并以鸢尾花数据为例,简单用python进行一下说明.如果对ROC和AUC二分类下的概念不是很了解,可以先参考下这篇文章:http://blog.c ...

  6. 模型评估指标-2-ROC与PR曲线对比,TPR/FPR/Precision关系,3种特殊的评估指标

    导语:在进阶篇里面,将会讨论ROC和PR曲线的联系,在不平衡数据中的偏差问题,同时利用公式来说明TPR/FPR/Precision三者之间的关系,在第三部分结合业务场景将介绍了几个特殊指标,但是没有说 ...

  7. python的print保留四位小数——TPR计算器——二分类TPR——五分类TPR

    仅作为记录,大佬请跳过. 文章目录 print保留四位小数 二分类TPR计算器 五分类TPR计算器 全部代码 使用 展示 参考 print保留四位小数 print(format(TPR,'.4f')) ...

  8. R语言使用yardstick包的roc_curve函数评估多分类(Multiclass)模型、并使用autoplot函数可视化模型在每个交叉验证(或者重采样)的每一折fold在每个分类上的ROC曲线

    R语言使用yardstick包的roc_curve函数评估多分类(Multiclass)模型的性能.并使用autoplot函数可视化模型在每个交叉验证(或者重采样)的每一折fold在每个分类上的ROC ...

  9. R语言使用yardstick包的roc_curve函数评估多分类(Multiclass)模型的性能、查看模型在多分类每个分类上的ROC曲线(roc curve)

    R语言使用yardstick包的roc_curve函数评估多分类(Multiclass)模型的性能.查看模型在多分类每个分类上的ROC曲线(receiver operating characteris ...

最新文章

  1. 梯度下降(Gradient Descent),一句代码,一个式子
  2. CTF(Pwn) Rop + ret2libc 题型 常规解法思路 (初级)
  3. oracle中lead函数,oracle lead()函数 | 学步园
  4. sklearn自学指南(part35)--近邻传播及均值漂移
  5. FPFH+ICP点云配准
  6. 用linux命令通常做什么,如何知道你在 Linux 里最常使用的几个命令?
  7. Drools 6.5.0.Final提供
  8. Java核心篇之Java锁--day2
  9. matlab中基于cdma的锁相环,答辩-基于MATLAB的CDMA通信系统设计与仿真.ppt
  10. 【C++】带空格输入
  11. 【Python】Python3.7.3 - Python命令行参数详解
  12. 如何入门嵌入式?ARM嵌入式开发板学习方法步骤
  13. confluence权限管理
  14. Excel VBA高级编程-微信群发消息工具
  15. su, su -, sudo
  16. 克鲁斯卡尔(Kruskal)
  17. 使用ffmpeg对视频进行画面裁剪
  18. Qt之标签和单行文本编辑框(QLabel、QLineEdit)
  19. 2022安全员-C证考试题模拟考试题库及模拟考试
  20. 安徽省c语言考试时间,安徽省年月二级C语言考试.doc

热门文章

  1. 程序员在工作中这样做,会省去一大堆烦恼
  2. 电信主机托管费用_电信托管服务器需要如何计费?
  3. 智能床垫到底有多智能-新导智能
  4. Scrapy爬取饿了么周围商家信息
  5. 差点就给牦牛剪毛了!
  6. 51单片机的步进电机控制系统(仿真+程序+报告+原理图)
  7. 关于vue告警:Closing curly brace does not appear on the same line as the subsequent block
  8. google 天气rss
  9. 高考如何改变30位互联网大佬的人生?张一鸣,黄峥,蒋凡,马化腾...
  10. MD5简介及其算法源码