一. 分类(classification)

1. confusion matrix

预测阴性 预测阳性
实际阴性 True Negative(TN) False Positive(FP)
实际阳性 False Negative(FN) True Positive(TP)

在这里的二分类中,以阴阳区分两类别,以真假代表预测是否符合。可有以下指标:

(1)准确率:

相当偏颇的统计值,测试集里类别越不均衡,这个值越不可信。下面F1 score, AUC等都是修正它的。

(2)召回率(阳性):

(3)精确率(阳性):

(4) score:

precisoin和recall差别很大时用,为二者的调和平均数。为权重,当时,权重相等,是为F1 score。


在医学领域,若以阴性为无病,阳性为有病,则有:

(1)敏感度:

等同于阳性召回率,代表把所有阳性病人找到的能力。若为100%,则无漏诊。

(2)特异度:

等同于阴性召回率,代表把所有无病的人找到的能力。

(3)精确度(Positive Predictive Value, PPV):

等同于阳性准确率,说你有病是不是真有病。

(4)负预测性(Negative Predictive Value, NPV):

等同于阴性准确率,说你没病是不是真没病。


2. ROC(Receiver Operating Characteristic)曲线:

横坐标为FPR(假阳率,所有阴性样本中阳性概率)=FP/(N-),纵坐标为TPR(真阳率,所有阳性样本中阳性概率)=TP/(N+)。这个图怎么画的呢?因为每个样本都有预测为阳性的概率值,将这些概率值排序,通过设置各个概率值为阳性阈值,可以得到不同的混淆矩阵,得到不同的FPR和TPR,则得到一系列图上的点。

(1)EER(Equal Error Rate):FPR=FNR(假阴率,所有阳性样本中阴性概率)的时候的点。由于FNR=1-TPR,这个点可由ROC曲线和(0,1),(1,0)之间连线的交点得到。越靠近(0,1)点,说明在较小的假阳情况下,可以达到更多的真阳性效果,则分类效果越好。若为(0,1),则分类器每次预测都是对的,且信念100%。

(2)AUC(Area Under Curve):ROC曲线下面积,越大,则说明在较小的假阳情况下,可以达到更多的真阳性效果,则分类效果越好。若为1,则分类器每次预测都是对的,且信念100%。(物理意义:首先AUC值是一个概率值,当你随机挑选一个正样本以及一个负样本,当前的分类算法根据计算得到的Score值将这个正样本排在负样本前面的概率就是AUC值。)

最差ROC为(0,0)和(1,1)之间连线,此时AUC=0.5,EER=(0.5,0.5),如果凹进去了,则把预测值01互换,可得到较好的反向操作分类器。

3. Kappa值:

一致性检验,-1~1,越高越好。

考虑二分类的混淆矩阵,第一行为a,b,第二行为c,d,化简可得到

当ad=bc时,纯瞎蒙,K=0;ad<bc时,还不如瞎蒙,最好反向预测。

二、分割(segmentation)

1. Dice

P: prediction, G: ground truth

完全重合时等于1。

注:

2. pixel accuracy

类别不均衡的时候很偏颇。

3. Hausdorff distance

集合A中所有点,到集合B中所有点最短距离的最大值。

4. image level,pixel wise

level对应的是统计的集合个体,wise是指统计的单位。例如:lesion level,pixel wise就是对各个病灶,以模型在pixel上的表现进行统计。

三、回归(regression)

1. Mean Absolute Error

2. Mean Squared Error

3. Root Mean Squared Error

四、检测(detection)

0. NMS(Non-Maximum Suppression)

根据score进行bounding box排序,对于最大的那个,在剩余的bounding box里面去掉和它重合度较高的(IOU大于某个阈值)。然后是score第二大的,以此类推,直到遍历所有bounding boxes。

1. precision, recall

TP:IOU > 0.5的检测框数量

FP:IOU <= 0.5的检测框数量,以及对应同一个ground truth多余检测框的数量

FN:没有检测到的检测框数量

                    

2. PR曲线(Precision Recall Curve)

类似ROC曲线的绘制方法,将每个样本预测为阳性的概率值排序,通过设置各个概率值为阳性阈值,可以得到不同的混淆矩阵,得到不同的precision和recall,则得到一系列图上的点。

(1)平衡点(Break-Event point, BER)为PR曲线和y=x直线的交点。代表precision=recall二者的取值,这个值越高,分类器越好。

(2)检测任务面临大量负样本的问题,更关注的是模型区分正样本的能力。相较于ROC曲线,PR曲线更关注正样本,是一个更有效的评价指标。

(3)AP(Average Precision)是PR曲线下的面积,越大越好。

(4)上面的PR图我个人认为并不精确,因为不会出现recall=1,precision=0的情况,当然如果正负样本比例非常悬殊可能非常接近这个点。

3. mAP(mean Average Precision)

每一类都有各自的AP,将这些AP求均值。

五、其他

1. 速度(FLOPs:floating point operations ,浮点运算次数,可理解为计算量,可以用来衡量算法/模型的复杂度)

2. 参数量

3. 显存占用

machine learning measurements相关推荐

  1. An example machine learning notebook

    原文地址 An example machine learning notebook Notebook by Randal S. Olson Supported by Jason H. Moore Un ...

  2. 【Paper】ConvLSTM:Convolutional LSTM Network: A Machine Learning Approach for Precipitation Nowcasting

    论文原文 论文下载 论文被引:1651(2020/03/01) 4827(2022/03/26) 论文年份:2015 文章目录 Abstract 1 Introduction 2 Preliminar ...

  3. Where Can Machine Learning Help Robotic State Estimation 机器学习在机器人状态估计的应用

    Where Can Machine Learning Help Robotic State Estimation Tim Barfoot 关于机器学习在机器人状态估计中应用的报告演讲.演讲时间2021 ...

  4. Machine Learning for Computer Systems and Networking:A Survey ---综述阅读 对于计算机系统和网络的机器学习

    摘要: Machine learning (ML) has become the de-facto approach for various scientific domains such as co ...

  5. bff v2ex_语音备忘录的BFF-如何通过Machine Learning简化Speech2Text

    bff v2ex by Rafael Belchior 通过拉斐尔·贝尔基奥尔(Rafael Belchior) 语音备忘录的BFF-如何通过Machine Learning简化Speech2Text ...

  6. 吴恩达新书《Machine Learning Yearning》完整中文版 PDF 下载!

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale资源 推荐人:GithubDaily,Datawhale伙伴 <Mach ...

  7. 吴恩达《Machine Learning》Jupyter Notebook 版笔记发布!图解、公式、习题都有了

    在我很早之前写过的文章<机器学习如何入门>中,就首推过吴恩达在 Coursera 上开设的<Machine Learning>课程.这门课最大的特点就是基本没有复杂的数学理论和 ...

  8. 吴恩达新书《Machine Learning Yearning》完整中文版开源!

    选自Github 来源:机器学习算法与自然语言处理 吴恩达新书<Machine Learning Yearning>完整中文版开源,整理给大家. <Machine Learning ...

  9. Auto Machine Learning 自动化机器学习笔记

    ⭐适读人群:有机器学习算法基础 1. auto-sklearn 能 auto 到什么地步? 在机器学习中的分类模型中: 常规 ML framework 如下图灰色部分:导入数据-数据清洗-特征工程-分 ...

  10. 机器学习与优化基础(Machine Learning and Optimization)

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文转自|新机器视觉 引用大佬Pedro Domingos的说法: ...

最新文章

  1. 阿里Java岗P5-P7成长笔记【3283页PDF文档】
  2. mysql实时读写_[DataBase] MySql 查看实时日志
  3. core identity mysql_Asp.Net Core Identity 4 改成 MySql/MariaDB
  4. 笔记整理-信息系统开发基础-软件测试-模糊测试
  5. Fragment基础讲解
  6. linux无法下载ftp,linux 不能下载怎么办
  7. 常见 Java 异常解释(恶搞版)
  8. 小程序和vue语法对比_商城小程序对比传统电商的优势如何?
  9. 附件文件超过了服务器的大小,Exchange 2010设置附件大小
  10. word文档中添加公式、插入数学公式及其编号
  11. html几个重要标签用法(div,p,span,ul,li,dl,dt,dd,a,img,h,strong,em)
  12. 丽台 A6800XT TDH (AGP) 显卡软件开管和超频手记
  13. Apriori算法学习和java实现
  14. codeforces1098D Eels
  15. Goland中在文件模板中为go文件添加个人声明
  16. R-VQA: Learning Visual Relation Facts with Semantic Attention for Visual Question Answering
  17. iOS 一个错误 Unable to find a specification for
  18. 喜上加喜|怿星科技荣获高工智能金球奖两项大奖
  19. MySQL数据库的约束
  20. 不同地域的内容偏好性分析

热门文章

  1. Pillow 库简介
  2. 3---IO流练习题库
  3. tplink703无线打印服务器,tplink703路由器怎么配置client模式
  4. 音频处理工具 GoldWave / Cool Edit Pro
  5. 在什么情况下需要用矿物质防火电
  6. 信息安全专业面试知识点整理(密码学与信数基础)
  7. python抢注最新到期删除域名!
  8. SQL Server 数据库维护计划
  9. C语言中的频率函数,请计算下列C语言程式片断或函数的频率计数和时间复杂度,如下所示 .DOC...
  10. 二元二次方程例题_二元二次方程练习题.doc