深度学习常用性能评价指标

  • 前言
  • 基于准确度的指标
  • 基于排名的指标
  • 基于图数据的指标

前言

深度学习性能指标是用于评价深度学习模型性能的依据,是设计模型的重要依据。

基于准确度的指标


对于模型而言仅统计预测正确或错误的个数其意义有限,标准化的衡量具有更准确的参考价值。
准确率(Accuracy, ACC):判断正确的结果与所有观测样本之比,ACC=TP+TNTP+FP+FN+TNACC= \frac{TP+TN}{TP+FP+FN+TN}ACC=TP+FP+FN+TNTP+TN​
精确率(precision)或阳性预测值(Positive Predictive Value, PPV):判断正确的结果占预测为positive的比例,Precision=TPTP+FPPrecision= \frac{TP}{TP+FP}Precision=TP+FPTP​
灵敏度(Sensitivity)或称召回率(Recall)或真阳率(True Positive Rate, TPR):模型预测正确的个数占真实值为positive的比例,Sensitivity=TPTP+FNSensitivity= \frac{TP}{TP+FN}Sensitivity=TP+FNTP​
特异度(Specificity)或选择率(Selectivity)或真阴率(True Negative Rate, TNR):判断正确的个数占真实值为Negative的比例,Specificity=TNTN+FPSpecificity= \frac{TN}{TN+FP}Specificity=TN+FPTN​
阴性预测值(Negative Predictive Value, NPV):判断正确的结果占预测为negative的比例,NPV=TNTN+FNNPV= \frac{TN}{TN+FN}NPV=TN+FNTN​
假阴率(False Negative Rate, FNR):判断错误的个数占真实值为positive的比例,FNR=FNFN+TPFNR= \frac{FN}{FN+TP}FNR=FN+TPFN​
假阳率(False Positive Rate, FPR):判断错误的个数占真实值为negative的比例,FPR=FPFP+TNFPR= \frac{FP}{FP+TN}FPR=FP+TNFP​
错误发现率(False Discovery Rate, FDR):预测错误的个数占预测值为positive的比例,FDR=FPFP+TPFDR= \frac{FP}{FP+TP}FDR=FP+TPFP​
错误遗漏率(False Omission Rate, FOR):预测错误的个数占预测值为negative的比例,FOR=FNFN+TNFOR= \frac{FN}{FN+TN}FOR=FN+TNFN​
威胁分数(Threat score, TS)或临界成功指数(critical success index, CSI):TS=TPTP+FN+FPTS= \frac{TP}{TP+FN+FP}TS=TP+FN+FPTP​
F分数(F-Score)是精度和召回率的调和平均值:F=2×precision×recallprecision+recall=2×TP2×TP+FN+FPF= 2\times\frac{precision\times recall}{precision+recall}= \frac{2\times TP}{2\times TP+FN+FP}F=2×precision+recallprecision×recall​=2×TP+FN+FP2×TP​
阳性似然比(Positive likelihood ratio, LR+):LR+=TPRFPRLR+= \frac{TPR}{FPR}LR+=FPRTPR​
阴性似然比(Negative likelihood ratio, LR-): LR−=FNRTNRLR-= \frac{FNR}{TNR}LR−=TNRFNR​
诊断优势比(Diagnostic odds ratio, DOR):DOR=LR+LR−DOR= \frac{LR+}{LR-}DOR=LR−LR+​
接收者操作特征曲线(receiver operating characteristic curve, ROC)是坐标图式的分析工具,其横轴为FPR,纵轴为TPR。
曲线下面积(Area Under Curve, AUC)是ROC曲线下的面积。
平均精度(Average Precision, AP)是衡量精确率和召回率的一种指标,当Recall阈值从0增加到1时,Precision越高,AP越高。Precision-Recall曲线描述了Precision和Recall之间的关系。 好的模型应该改善Recall,同时将Precision保留相对较高的分数。 相反,较弱的模型可能会损失更多的Precision以改善Recall。 与Precision-Recall曲线相比,AP可以更直观地显示模型的性能。

基于排名的指标

平均倒数排名(MRR): MRR是衡量排名模型的常用指标。 对于目标查询,如果第一个正确的项目排在第n位,则MRR分数为1/n,一旦不匹配,则分数为0,模型的MRR是所有查询的分数之和。
Hits@K:通过计算所有真实元组的排名(例如MRR),Hits @ K是排名在前K位的正确实体的比例。

基于图数据的指标

归一化互信息(NMI)和模块度是用来评估图上社区检测(即聚类)性能的两个指标。NMI起源于测量两个变量之间相互依赖性的信息理论。在社区检测场景中,NMI用于度量两个社区之间的共享信息量(即相似性)。模块度被设计用来衡量一个图划分成簇的强度。具有高模块度的图在簇内节点之间具有密集连接,而在不同簇中节点之间连接稀疏。
图属性统计数据指标包括基尼系数、特征路径长度、分布熵、幂律指数和三角形计数。一些更多的图统计指标包括度排序、接近中心性排序、中介中心性排序和使用的聚类系数、最短路径长度、对角线距离。

深度学习常用性能评价指标相关推荐

  1. 深度学习的性能评价指标---图像分类的评价指标

    图像分类的评价指标 图像分类的概念:是一个模式分类的问题,将不同的图像(注意单位,是一张图像,最后理解的如手写体的图像集)划分到不同的类别.单标签分类问题就是每一张图都有唯一的类别: 单标签分类的评价 ...

  2. 深度学习常用评价指标

    版权声明:本文为CSDN博主「ZONG_XP」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明. 原文链接:https://blog.csdn.net/zong59 ...

  3. Jetson Xavier、Jetson TX2、 1080(Ti)、2080显卡运行深度学习模型性能对比(英伟达开发平台VS常用显卡)

    前言:         英伟达的Jetson TX2使得很多人认为深度学习模型终于可以像嵌入式开发平台那样做到小型化了,不用再跑在高配计算机或者服务器上面了,但是实际上Jetson TX2开发板的性能 ...

  4. 4个提高深度学习模型性能的技巧

    点击上方"AI遇见机器学习",选择"星标"公众号 原创干货,第一时间送达 深度学习是一个广阔的领域,但我们大多数人在构建模型时都面临一些共同的难题 在这里,我们 ...

  5. 【AI不惑境】网络深度对深度学习模型性能有什么影响?

    大家好,这是专栏<AI不惑境>的第二篇文章,讲述模型深度与模型性能的关系. 进入到不惑境界,就是向高手迈进的开始了,在这个境界需要自己独立思考.如果说学习是一个从模仿,到追随,到创造的过程 ...

  6. 深度学习(二)——深度学习常用术语解释, Neural Network Zoo, CNN, Autoencoder

    Dropout(续) 除了Dropout之外,还有DropConnect.两者原理上类似,后者只隐藏神经元之间的连接. 总的来说,Dropout类似于机器学习中的L1.L2规则化等增加稀疏性的算法,也 ...

  7. 深度学习常用数据集介绍与下载(附网盘链接)

    摘要 这篇博文总结了博主收集的深度学习常用的数据集,包含常用的分类.目标检测及人脸识别任务,对每个数据集给出了简要介绍.官网下载网站以及公众号获取的关键字.因为有的数据集较大,官网的下载速度可能比较慢 ...

  8. NVIDIA数据中心深度学习产品性能

    NVIDIA数据中心深度学习产品性能 在现实世界的应用程序中部署AI,需要训练网络以指定的精度融合.这是测试AI系统的最佳方法-准备将其部署在现场,因为网络随后可以提供有意义的结果(例如,对视频流正确 ...

  9. 提升深度学习模型性能及网络调参

    提升深度学习模型性能及网络调参 https://www.toutiao.com/a6637086018950398472/ 图像处理与机器视觉 2018-12-25 10:42:00 深度学习有很多的 ...

最新文章

  1. oracle授权with,ORACLE权限关于with admin option和with grant option的用法
  2. leetcode 171. Excel表列序号
  3. AXI_03 AXI_LITE_SLAVE_IP核设计与验证
  4. url上接收到 el表达式 不渲染_一文摸透从输入URL到页面渲染的过程
  5. 世界坐标系到观察坐标系的变换步骤_带你轻松认识不同坐标系下向量的“变脸”——基变换...
  6. C#Brush的使用(转载)
  7. Ubuntu下安装配置Phabricator
  8. linux下编译opendds,Linux下编译OpenDDS
  9. 关于4442卡的读密码问题
  10. 彩影2008 白金版 10.1 build 2010
  11. 三、段地址与偏移地址
  12. 计算机的内存大小有何作用,电脑内存用处有多大?你可能想不到!
  13. 数理统计(四)-方差分析及回归分析:总变差分解【总变差=方差+效应A平方和+效应B平方和+AB交互效应平方和】、线性回归模型、回归方程、残差、残差平方和、σ的无偏估计、多元线性回归模型、非线性回归模型
  14. 使用EditPlus技巧,提高工作效率(附英文版、自动完成文件、语法文件下载)(转载)...
  15. SpringCloud之GateWay的基础使用
  16. 360网站卫士常用前端公共库CDN服务停掉了
  17. cocos2dx-lua制作新手引导
  18. 【云栖大会】菜鸟网络CTO王文彬:智慧互联 重构物流
  19. [Vue]非父子组件传值(bus/总线/观察者模式/发布订阅模式)
  20. cocosbuilder详细使用教程

热门文章

  1. DialogBoxIndirectParam
  2. [转载] issubclass在python中的意思_python issubclass 和 isinstance函数
  3. [转载] java 内部类与闭包
  4. FPGA与CPLD的区别
  5. 怎样从外网访问自己的HTTP服务器
  6. BZOJ.5093.[Lydsy1711月赛]图的价值(NTT 斯特林数)
  7. 设计模式之---解释器模式
  8. Cordova开发总结(插件篇)
  9. Uva 11395 Sigma Function (因子和)
  10. silverlight体验之三:简单控件堆成个Login