machine learning measurements
一. 分类(classification)
1. confusion matrix
预测阴性 | 预测阳性 | |
实际阴性 | True Negative(TN) | False Positive(FP) |
实际阳性 | False Negative(FN) | True Positive(TP) |
在这里的二分类中,以阴阳区分两类别,以真假代表预测是否符合。可有以下指标:
(1)准确率:
相当偏颇的统计值,测试集里类别越不均衡,这个值越不可信。下面F1 score, AUC等都是修正它的。
(2)召回率(阳性):
(3)精确率(阳性):
(4) score:
precisoin和recall差别很大时用,为二者的调和平均数。为权重,当
时,权重相等,是为F1 score。
在医学领域,若以阴性为无病,阳性为有病,则有:
(1)敏感度:
等同于阳性召回率,代表把所有阳性病人找到的能力。若为100%,则无漏诊。
(2)特异度:
等同于阴性召回率,代表把所有无病的人找到的能力。
(3)精确度(Positive Predictive Value, PPV):
等同于阳性准确率,说你有病是不是真有病。
(4)负预测性(Negative Predictive Value, NPV):
等同于阴性准确率,说你没病是不是真没病。
2. ROC(Receiver Operating Characteristic)曲线:
横坐标为FPR(假阳率,所有阴性样本中阳性概率)=FP/(N-),纵坐标为TPR(真阳率,所有阳性样本中阳性概率)=TP/(N+)。这个图怎么画的呢?因为每个样本都有预测为阳性的概率值,将这些概率值排序,通过设置各个概率值为阳性阈值,可以得到不同的混淆矩阵,得到不同的FPR和TPR,则得到一系列图上的点。
(1)EER(Equal Error Rate):FPR=FNR(假阴率,所有阳性样本中阴性概率)的时候的点。由于FNR=1-TPR,这个点可由ROC曲线和(0,1),(1,0)之间连线的交点得到。越靠近(0,1)点,说明在较小的假阳情况下,可以达到更多的真阳性效果,则分类效果越好。若为(0,1),则分类器每次预测都是对的,且信念100%。
(2)AUC(Area Under Curve):ROC曲线下面积,越大,则说明在较小的假阳情况下,可以达到更多的真阳性效果,则分类效果越好。若为1,则分类器每次预测都是对的,且信念100%。(物理意义:首先AUC值是一个概率值,当你随机挑选一个正样本以及一个负样本,当前的分类算法根据计算得到的Score值将这个正样本排在负样本前面的概率就是AUC值。)
最差ROC为(0,0)和(1,1)之间连线,此时AUC=0.5,EER=(0.5,0.5),如果凹进去了,则把预测值01互换,可得到较好的反向操作分类器。
3. Kappa值:
一致性检验,-1~1,越高越好。
考虑二分类的混淆矩阵,第一行为a,b,第二行为c,d,化简可得到
当ad=bc时,纯瞎蒙,K=0;ad<bc时,还不如瞎蒙,最好反向预测。
二、分割(segmentation)
1. Dice
P: prediction, G: ground truth
完全重合时等于1。
注:
2. pixel accuracy
类别不均衡的时候很偏颇。
3. Hausdorff distance
集合A中所有点,到集合B中所有点最短距离的最大值。
4. image level,pixel wise
level对应的是统计的集合个体,wise是指统计的单位。例如:lesion level,pixel wise就是对各个病灶,以模型在pixel上的表现进行统计。
三、回归(regression)
1. Mean Absolute Error
2. Mean Squared Error
3. Root Mean Squared Error
四、检测(detection)
0. NMS(Non-Maximum Suppression)
根据score进行bounding box排序,对于最大的那个,在剩余的bounding box里面去掉和它重合度较高的(IOU大于某个阈值)。然后是score第二大的,以此类推,直到遍历所有bounding boxes。
1. precision, recall
TP:IOU > 0.5的检测框数量
FP:IOU <= 0.5的检测框数量,以及对应同一个ground truth多余检测框的数量
FN:没有检测到的检测框数量
2. PR曲线(Precision Recall Curve)
类似ROC曲线的绘制方法,将每个样本预测为阳性的概率值排序,通过设置各个概率值为阳性阈值,可以得到不同的混淆矩阵,得到不同的precision和recall,则得到一系列图上的点。
(1)平衡点(Break-Event point, BER)为PR曲线和y=x直线的交点。代表precision=recall二者的取值,这个值越高,分类器越好。
(2)检测任务面临大量负样本的问题,更关注的是模型区分正样本的能力。相较于ROC曲线,PR曲线更关注正样本,是一个更有效的评价指标。
(3)AP(Average Precision)是PR曲线下的面积,越大越好。
(4)上面的PR图我个人认为并不精确,因为不会出现recall=1,precision=0的情况,当然如果正负样本比例非常悬殊可能非常接近这个点。
3. mAP(mean Average Precision)
每一类都有各自的AP,将这些AP求均值。
五、其他
1. 速度(FLOPs:floating point operations ,浮点运算次数,可理解为计算量,可以用来衡量算法/模型的复杂度)
2. 参数量
3. 显存占用
machine learning measurements相关推荐
- An example machine learning notebook
原文地址 An example machine learning notebook Notebook by Randal S. Olson Supported by Jason H. Moore Un ...
- 【Paper】ConvLSTM:Convolutional LSTM Network: A Machine Learning Approach for Precipitation Nowcasting
论文原文 论文下载 论文被引:1651(2020/03/01) 4827(2022/03/26) 论文年份:2015 文章目录 Abstract 1 Introduction 2 Preliminar ...
- Where Can Machine Learning Help Robotic State Estimation 机器学习在机器人状态估计的应用
Where Can Machine Learning Help Robotic State Estimation Tim Barfoot 关于机器学习在机器人状态估计中应用的报告演讲.演讲时间2021 ...
- Machine Learning for Computer Systems and Networking:A Survey ---综述阅读 对于计算机系统和网络的机器学习
摘要: Machine learning (ML) has become the de-facto approach for various scientific domains such as co ...
- bff v2ex_语音备忘录的BFF-如何通过Machine Learning简化Speech2Text
bff v2ex by Rafael Belchior 通过拉斐尔·贝尔基奥尔(Rafael Belchior) 语音备忘录的BFF-如何通过Machine Learning简化Speech2Text ...
- 吴恩达新书《Machine Learning Yearning》完整中文版 PDF 下载!
↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale资源 推荐人:GithubDaily,Datawhale伙伴 <Mach ...
- 吴恩达《Machine Learning》Jupyter Notebook 版笔记发布!图解、公式、习题都有了
在我很早之前写过的文章<机器学习如何入门>中,就首推过吴恩达在 Coursera 上开设的<Machine Learning>课程.这门课最大的特点就是基本没有复杂的数学理论和 ...
- 吴恩达新书《Machine Learning Yearning》完整中文版开源!
选自Github 来源:机器学习算法与自然语言处理 吴恩达新书<Machine Learning Yearning>完整中文版开源,整理给大家. <Machine Learning ...
- Auto Machine Learning 自动化机器学习笔记
⭐适读人群:有机器学习算法基础 1. auto-sklearn 能 auto 到什么地步? 在机器学习中的分类模型中: 常规 ML framework 如下图灰色部分:导入数据-数据清洗-特征工程-分 ...
- 机器学习与优化基础(Machine Learning and Optimization)
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文转自|新机器视觉 引用大佬Pedro Domingos的说法: ...
最新文章
- 阿里Java岗P5-P7成长笔记【3283页PDF文档】
- mysql实时读写_[DataBase] MySql 查看实时日志
- core identity mysql_Asp.Net Core Identity 4 改成 MySql/MariaDB
- 笔记整理-信息系统开发基础-软件测试-模糊测试
- Fragment基础讲解
- linux无法下载ftp,linux 不能下载怎么办
- 常见 Java 异常解释(恶搞版)
- 小程序和vue语法对比_商城小程序对比传统电商的优势如何?
- 附件文件超过了服务器的大小,Exchange 2010设置附件大小
- word文档中添加公式、插入数学公式及其编号
- html几个重要标签用法(div,p,span,ul,li,dl,dt,dd,a,img,h,strong,em)
- 丽台 A6800XT TDH (AGP) 显卡软件开管和超频手记
- Apriori算法学习和java实现
- codeforces1098D Eels
- Goland中在文件模板中为go文件添加个人声明
- R-VQA: Learning Visual Relation Facts with Semantic Attention for Visual Question Answering
- iOS 一个错误 Unable to find a specification for
- 喜上加喜|怿星科技荣获高工智能金球奖两项大奖
- MySQL数据库的约束
- 不同地域的内容偏好性分析
热门文章
- Pillow 库简介
- 3---IO流练习题库
- tplink703无线打印服务器,tplink703路由器怎么配置client模式
- 音频处理工具 GoldWave / Cool Edit Pro
- 在什么情况下需要用矿物质防火电
- 信息安全专业面试知识点整理(密码学与信数基础)
- python抢注最新到期删除域名!
- SQL Server 数据库维护计划
- C语言中的频率函数,请计算下列C语言程式片断或函数的频率计数和时间复杂度,如下所示 .DOC...
- 二元二次方程例题_二元二次方程练习题.doc