-

衡量二分类问题的统计指标

分类结果

二分类问题，分类结果有以下四种情况：

- 真阴性（TN，True Negative），事实为阴性并预测为阴性。

- 真阳性（TP，True Positive），事实为阳性并预测为阳性。

- 假阴性（FN，False Negative），事实为阳性但预测为阴性。

- 假阳性（FP，False Positive），事实为阴性但预测为阳性。

		真实类别
		1 Positive	0 Negative
预测类别	1 Positive	True Positive 真阳性	False Positive 假阳性
预测类别	0 Negative	False Negative 假阴性	True Negative 真阴性

混淆矩阵

混淆矩阵（Confusion Matrix）是将四种情况各自预测结果的计数，以矩阵形式表示出来。

(TNFPFNTP)\begin{pmatrix} TN & FP \\ FN & TP \end{pmatrix} (TNFNFPTP)

准确率

准确率（Accuracy）是指所有预测中预测准确的比例：

Accuracy=TP+TNTP+TN+FP+FNAccuracy = {TP + TN \over TP + TN + FP + FN} Accuracy=TP+TN+FP+FNTP+TN

精确率

精确度（Precision）是指正确预测阳性占所有预测为阳性的比例：

Precision=TPTP+FPPrecision = {TP \over TP + FP} Precision=TP+FPTP

召回率

召回率（Recall）是指正确预测的阳性占所有事实是阳性的比例：

Recall=TPTP+FNRecall = {TP \over TP + FN} Recall=TP+FNTP

F1评分

F1分数（F1 Score），是统计学中用来衡量二分类模型精确度的一种指标。它同时兼顾了分类模型的精确率和召回率。F1分数可以看作是模型精确率和召回率的一种调和平均，它的最大值是1，最小值是0。

F1=2Recall∗PrecisionRecall+Precision=2TP2TP+FN+FPF1 = 2{ Recall * Precision \over Recall + Precision} = { 2TP \over 2TP + FN + FP } F1=2Recall+PrecisionRecall∗Precision=2TP+FN+FP2TP

推导过程

F1=2Recall∗PrecisionRecall+Precision=2TPTP+FN∗TPTP+FPTPTP+FN+TPTP+FP=2∗TP2(TP+FN)(TP+FP)TP2+TP∗FP+TP2+TP∗FN(TP+FN)(TP+FP)=2∗TP22TP2+TP∗FP+TP∗FN=2TP2TP+FN+FPF1 = 2{ Recall * Precision \over Recall + Precision} \\ = 2{ {TP \over TP + FN} * {TP \over TP + FP} \over {TP \over TP + FN} + {TP \over TP + FP} } \\ = 2 * { {TP^2 \over (TP + FN)(TP + FP)} \over {TP^2 + TP*FP + TP^2 + TP*FN \over (TP + FN)(TP + FP)} } \\ = 2 * { TP^2 \over 2TP^2 + TP*FP + TP*FN } \\ = { 2TP \over 2TP + FN + FP } F1=2Recall+PrecisionRecall∗Precision=2TP+FNTP+TP+FPTPTP+FNTP∗TP+FPTP=2∗(TP+FN)(TP+FP)TP2+TP∗FP+TP2+TP∗FN(TP+FN)(TP+FP)TP2=2∗2TP2+TP∗FP+TP∗FNTP2=2TP+FN+FP2TP

ROC曲线、AUC

ROC曲线（Receiver Operating Characteristic Curve）显示了分类模型在所有分类阈值下的性能，它描绘了真阳性率（Y轴）和假阳性率（X轴的关系）。

ROC曲线越“陡峭”，越接近理想结果：最大化真阳性率和最小化假阳性率。即图中左上角是“理想”点-假阳性率为0，真阳性率为1。

ROC曲线下的面积（Area Under the Roc Curve，AUC）计算从(0,0)到(1,1)的整个ROC曲线下的二维区域的面积,AUC越大越好。

衡量二分类模型的统计指标（TN,TP,FN,FP,F1,准确,精确,召回,ROC,AUC）相关推荐

[机器学习] 二分类模型评估指标---精确率Precision、召回率Recall、ROC|AUC
一为什么要评估模型? 一句话,想找到最有效的模型.模型的应用是循环迭代的过程,只有通过持续调整和调优才能适应在线数据和业务目标. 选定模型时一开始都是假设数据的分布是一定的,然而数据的分布会随着时间 ...
TP FN FP TN
Rachel-Zhang写的TP FN FP TN ROC True Positive (真正, TP)被模型预测为正的正样本:可以称作判断为真的正确率 True Negative(真负 , TN)被 ...
AI：神经网络IMDB电影评论二分类模型训练和评估
AI:Keras神经网络IMDB电影评论二分类模型训练和评估,python import keras from keras.layers import Dense from keras import ...
【Kay】机器学习——二分类模型的评价
一.评价二分类模型的好坏二分类问题:预测这条数据是0还是1的问题 1.混淆矩阵数字代表个数 2.准确率.精确率.召回率 ①准确率: ②精确率(查准率): ③召回率(查全率recall) : ④ ...
分类模型-评估指标（2）：ROC曲线、 AUC值（ROC曲线下的面积）【只能用于二分类模型的评价】【不受类别数量不平衡的影响；不受阈值取值的影响】【AUC的计算方式：统计所有正负样本对中的正序对】
评价二值分类器的指标很多,比如precision.recall.F1 score.P-R曲线等.但这些指标或多或少只能反映模型在某一方面的性能.相比而言,ROC曲线则有很多优点,经常作为评估二值分类器 ...
RDKit | 基于随机森林的化合物活性二分类模型
基于随机森林算法的化合物二分类机器学习模型代码示例 #导入依赖包 import pandas as pd import numpy as np from rdkit import Chem, Dat ...
深度学习框架tensorflow二实战（训练一个简单二分类模型）
导入工具包 import os import warnings warnings.filterwarnings("ignore") import tensorflow as tf ...
pytorch实现二分类模型
使用的数据集是iris 一共150行数据, 三种花各有50行数据, 这里取了前100行, 选两种花进行二分类. 数据集地址:https://github.com/hydra-ZD/AI/blob/ma ...
混淆矩阵（TP+FN+FP+TN）
1.定义混淆矩阵就是分别统计分类模型归错类,归对类的观测值个数,然后把结果放在一个表里展示出来.这个表就是混淆矩阵.混淆矩阵其实就是一张表格而已. 以分类模型中最简单的二分类为例,对于这种问题,我们 ...

衡量二分类模型的统计指标（TN,TP,FN,FP,F1,准确,精确,召回,ROC,AUC）

文章目录

-