数据分析与挖掘(一)误差与精度
分类与预测算法的评价
模型对数据进行训练,为了判断一个模型的性能。需要一组没有参与预测模型的数据集,并用该数据集上评价预测模型的准确率。模型的预测效果评价,通常用相对/绝对误差,平均绝对误差,均方误差,均方根误差。
绝对误差与相对误差
设为实际值,为预测值,则称为绝对误差,如下:
为相对误差(RelativeError),如下:
平均绝对误差
平均绝对误差(MeanAbsoluteError)如下:
由于预测误差有正负,为了避免正负抵消。所以采用绝对值并取其平均值。
均方误差
均方误差(Mean Squared Error, MSE)如下:
均方误差是预测误差平方和的平均数,由于加强了数值大的误差在指标中的作用,从而提高了这个指标的灵敏性。
均方根误差
均方根误差(Root Mean Squared Error, RMSE)如下:
这是均方误差的平方根,代表了预测值的离散程度,也称为标准误差,最佳拟合情况为
识别准确度
识别准确度(Accuracy)定义如下:
式中 各项说明如下:
TP(True Positive):正确的肯定表示正确肯定的分类数
TN(True Negative):正确的否定表示正确否定的分类数
FP(False Positive):错误的肯定表示错误肯定的分类数
FN(False Negative):错误的否定表示错误否定的分类数
识别精确率
识别精确率(Precision)定义如下:
反馈率
反馈率(Recall)定义如下:
数据分析与挖掘(一)误差与精度相关推荐
- Python数据分析和挖掘之入门理论+实操
Python数据分析和挖掘听课笔记 1.集中趋势.离中趋势 2.数据分布 3.抽样理论 代码实现 4.数据分类 5.单属性分析 分析类别详解 实例运用 np.histogram函数 简单对比分析操作 ...
- Python数据分析与挖掘实战期末考复习(抱佛脚啦)
期末三天赛高考我真的会谢,三天学完数据挖掘--真的很极限了的. 课本是那本绿色的Python数据分析与挖掘实战(第2版),作者张良均- 图片来自老师给的ppt,以下内容是我自己总结的,自己复习用,覆盖 ...
- 数据分析与挖掘:财政收入影响因素分析及预测模型
财政收入影响因素分析及预测模型 1. 背景与挖掘目标 2. 分析方法与过程 2.1 数据探索 2.2 模型构建 2.3 数据预测 1. 背景与挖掘目标 项目为<Python 数据分析与挖掘实战& ...
- python数据分析与挖掘实战 之笔记2
<python数据分析与挖掘实战>学习笔记2 经过前面章节的分析,即对数据进行探索和预处理,得到了处理后的数据.根据所得到的数据建立分类与预测.聚类分析.关联规则.时序模式.和偏差检测等模 ...
- 数据分析与挖掘实战-应用系统负载分析与磁盘容量预测
应用系统负载分析与磁盘容量预测 背景 某大型企业为了信息化发展的需要,建设了办公自动化系统.人力资源管理系统.财务管理系统.企业信息门户系统等几大企业级应用系统.因应用系统在日常运行时,会对底层软硬件 ...
- 《Python数据分析与挖掘实战》第11章——应用系统负载分析与磁盘容量预测(时间序列)
文章目录 1.背景与目标分析 2.2 数据探索 2.1 查看数据信息 2.2 数据平稳性分析 3 数据预处理 3.1 数据清洗 3.2 数据变换--属性构造 4 模型构建 4.1 确定模型-- ARM ...
- 从零开始学python数据分析-从零开始学Python数据分析与挖掘 PDF 下载
资料目录: 目 录第1章 数据分析与挖掘概述 11.1 什么是数据分析和挖掘 11.2 数据分析与挖掘的应用领域 21.2.1 电商领域--发现破坏规则的"害群之马" 21.2.2 ...
- python pd Series 添加行_Python数据分析与挖掘的常用工具
Python语言:简要概括一下Python语言在数据分析.挖掘场景中常用特性: 列表(可以被修改),元组(不可以被修改) 字典(结构) 集合(同数学概念上的集合) 函数式编程(主要由lambda(). ...
- 数据分析与挖掘中常用Python库的介绍与实践案例
数据分析与挖掘中常用Python库的介绍与实践案例 一.Python介绍 现在python一词对我们来说并不陌生,尤其是在学术圈,它的影响力远超其它任何一种编程语言, 作为一门简单易学且功能强大的编程 ...
- 【数据分析与挖掘实战】金融风控之贷款违约预测详解2(有代码和数据集)
本文接着上一篇博客,如果您未阅读上篇博客,请点击[数据分析与挖掘实战]金融风控之贷款违约预测详解1(有代码和数据集) 七.建模和调参 7.1模型相关原理介绍 由于相关算法原理篇幅较长,本文推荐了一些博 ...
最新文章
- 和12岁小同志搞创客开发:如何驱动LCD1602液晶显示屏?
- memcache基础教程
- 设计模式之简单工厂模式学习笔记
- 结对项目-四则运算 “软件”之升级版
- Python编程基础:第十节 while循环While Loops
- IntelliJ IDEA添加过滤文件或目录(转)
- [Java基础]标准输入输出流
- 使用SaxParser和完整代码进行XML解析
- Know more about _in_memory_undo
- 如何在settings里的休眠模式里添加永不休眠
- uclient和thinkphp的class db的冲突
- Servlet+jsp入门教程
- 计算机组成原理笔记(一):概述
- 股票模拟交易日志(七)
- js数组操作的一些方法在面试题的使用
- Gradually Vanishing Bridge for Adversarial Domain Adaptation(CVPR2020)笔记
- 2345王牌浏览器如何使用小窗播放?
- 跳舞(shuffle) 时限:1s 空间:256m
- JS如何终止forEach循环
- 基于Multisim的buck降压斩波电路仿真