数据挖掘 -- 分类的模型评估度量
数据挖掘 – 分类的模型评估度量
混淆矩阵 CM(Confusion Matrix)
actual/precide | Yes | No | 合计 |
---|---|---|---|
Yes | TP | FN | P |
No | FP | TN | N |
合计 | P^ | N^ | P+N 或者 P^ + N^ |
术语 | 含义 | 例子 |
---|---|---|
TP(True Postive) : | 正确 分类的 正元组 | buy_computer = yes 的元组,被分类器预测为 buy_computer = yes |
TN(True Negative) : | 正确 分类的 负元组 | buy_computer = no 的元组,被分类器预测为 buy_computer = no |
FP(False Postive) : | 错误 标记为 正元组 的负元组 | buy_computer = no 的元组,被分类器预测为 buy_computer = yes |
FN(False Negative) : | 错误 标记为 负元组 的正元组 | buy_computer = yes 的元组,被分类器预测为 buy_computer = no |
度量
度量 | 公式 | 含义 |
---|---|---|
准确率、识别率(accuracy) | TP+TNP+N\frac{TP+TN}{P+N}P+NTP+TN | 正确分类元组 的占比 |
错误率、误分类率 (error rate / 1-accuracy) | FP+FNP+N\frac{FP+FN}{P+N}P+NFP+FN | 错误分类元组 的占比 |
敏感度、真正例率、召回率( recall / sensitivity) | TPP\frac{TP}{P}PTP | 正确识别的正元组 的占比 |
特效性、真负例率( specificity) | TNN\frac{TN}{N}NTN | 正确识别的负元组 的占比 |
精度 (precision) | TPTP+FP\frac{TP}{TP+FP}TP+FPTP | 标记为正类的元组实际为正类所占 的百分比 |
F、F1、F分数 | 2∗precision∗recallprecision+recall\frac{2 * precision * recall}{precision+ recall}precision+recall2∗precision∗recall | 精度和召回率的调和均值(另一种使用precision和recall的方法) |
FβF_βFβ : β是非负实数 | (1+β2)∗precision+recallβ2∗precision+recall\frac{(1+β^2) *precision+ recall}{β^2*precision+ recall}β2∗precision+recall(1+β2)∗precision+recall | 也是 另一种使用precision和recall的方法 |
ROC
轴 | 含义 | 公式 |
---|---|---|
Y轴(TPR) | sensitivity / recall | TPP\frac{TP}{P}PTP |
X轴(FPR) | 1-specificity | FPN\frac{FP}{N}NFP |
相关文章:
https://jingyan.baidu.com/article/63acb44acf685161fcc17ec9.html
https://www.plob.org/article/12476.html
相关图像
数据挖掘 -- 分类的模型评估度量相关推荐
- 多种分类以及模型评估
多种分类以及模型评估 分类 获取mnist数据集 获取训练数据和标签 数据标准化及数据集划分 训练二分类器 划分数据集 随机梯度下降分类 性能测试 使用交叉验证测量准确率 傻瓜版分类器 混淆矩阵 随机 ...
- 数据挖掘读书笔记--第八章(下):分类:模型评估与选择、提高分类器准确率技术
散记知识点 --"评估分类器,提高分类器" 5. 模型评估与选择 5.1 评估分类器性能 (1) 评估分类器性能的度量 评估分类器性能的度量主要有:准确率(识别率).敏感度(召回率 ...
- 不平衡多分类问题模型评估指标探讨与sklearn.metrics实践
我们在用机器学习.深度学习建模.训练模型过程中,需要对我们模型进行评估.评价,并依据评估结果决策下一步工作策略,常用的评估指标有准确率.精准率.召回率.F1分数.ROC.AUC.MAE.MSE等等,本 ...
- 【深度学习】深度学习分类与模型评估
内容大纲 分类和回归之外的机器学习形式 评估机器学习模型的规范流程 为深度学习准备数据 特征工程 解决过拟合问题 处理机器学习问题的通用流程 监督学习的主要种类及其变种 主要包括两大类问题: 分类 回 ...
- 机器学习模型评估的方法总结(回归、分类模型的评估)
建模的评估一般可以分为回归.分类和聚类的评估,本文主要介绍回归和分类的模型评估: 一.回归模型的评估 主要有以下方法: 指标 描述 metrics方法 Mean Absolute Error(MAE) ...
- (1-4)sklearn库的----模型评估
5,模型评估与选择 务必记住那些指标适合分类,那些适合回归. 一,分类问题 常见的分类模型包括:逻辑回归.决策树.朴素贝叶斯.SVM.神经网络等, 分类的模型评估指标包括以下几种: 1.TPR.FPR ...
- R语言分类模型:逻辑回归模型LR、决策树DT、推理决策树CDT、随机森林RF、支持向量机SVM、Rattle可视化界面数据挖掘、分类模型评估指标(准确度、敏感度、特异度、PPV、NPV)
R语言分类模型:逻辑回归模型LR.决策树DT.推理决策树CDT.随机森林RF.支持向量机SVM.Rattle可视化界面数据挖掘.分类模型评估指标(准确度.敏感度.特异度.PPV.NPV) 目录
- 分类决策树考虑了经验风险吗_数据挖掘导论 第4章 分类:基本概念、决策树与模型评估...
第4章 分类:基本概念.决策树与模型评估 分类(classification):分类任务就是通过学习得到一个目标函数(target function)f,把每个属性集x映射到一个余弦定义的类标号y.目 ...
- 数据挖掘 —— 模型评估
数据挖掘 -- 模型评估 1.分类模型评估(一) 1.1 二分类模型 1.2 多分类模型 1.3 代码 2.分类模型评估(二) 2.1 ROC 与 AUC 2.2 代码 1.分类模型评估(一) 1.1 ...
最新文章
- jQuery的选择器(一)
- 【Linux学习】Ubuntu下内核编译(一)
- Linux memcached 安装
- vs编译c语言文件不读取对象式宏,C代码的条编译宏windows的VS和linux下gcc编译不一样...
- 一个明确用户界面需求的想法
- DOM中Property与Attribute的区别
- Python 分布式文件系统 Mongodb GridFS
- U盘安装linux后无法引导
- 华为p50 pro 鸿蒙,华为P50Pro真豪横!鸿蒙系统+真全屏5摄,网友:太香了!
- 一般家用监控多少钱_安装空调一般多少钱
- AngularJS中$apply
- ocr 哪个好 外文_5 款堪称神器的高质量软件,每一款都好用到不想卸载
- 20190911每日一句
- android 5.0 截屏权限,Android 5.0 无Root权限实现截屏
- 不讲武德的Python反爬神器『fake_useragent』
- 如何选择舒适的双肩包/电脑包
- 【前端】菜单栏设计(html、css)
- ffmpeg libx264 h264_nvenc 编码参数解析
- 冷笑话 企鹅与北极熊
- FastReport 分组按每组单独一页打印
热门文章
- 部署可道云_可道云-快速搭建个人用云网盘
- sap委外采购订单冲销 102_SAP那些事-实战篇-68-谈谈SAP的库存设计理念
- [HNOI2007] 分裂游戏
- 龙应台--为什么我要求你读书用功
- 洛谷P2134 百日旅行
- NAS 百科 —— http://baike.baidu.com/item/NAS%E7%BD%91%E7%BB%9C%E5%AD%98%E5%82%A8
- EASYUI- EASYUI左移右移 GRID中值
- 工厂支持多数据库开发的三层结构模式随笔(一)
- ei拼音的四个声调对应的字_非常容易混淆的汉语拼音“er”,究竟特殊在哪里?孩子总是搞不懂...
- python文本进度条代码解释_python动态文本进度条的实例代码