转自:https://blog.csdn.net/Orange_Spotty_Cat/article/details/80312154

1.意义

Z-Score通过(x-μ)/σ将两组或多组数据转化为无单位的Z-Score分值,使得数据标准统一化,提高了数据可比性,削弱了数据解释性。

就是减去均值,比上标准差。

2.在DM中的位置

数据分析与挖掘中,很多方法需要样本符合一定的标准,如果需要分析的诸多自变量不是同一个量级,就会给分析工作造成困难,甚至影响后期建模的精准度。

Z-Score的主要目的就是将不同量级的数据统一转化为同一个量级,统一用计算出的Z-Score值衡量,以保证数据之间的可比性。

公式如下:

//很容易理解,但是在实际应用中,需要知道怎么去用。

转载于:https://www.cnblogs.com/BlueBlueSea/p/10028935.html

Z-score标准化[转载]相关推荐

  1. FLV文件格式(Z)(转载)

    刚才在看一些关于demux的东西,在处理flv格式的文件的时候,由于自己对flv文件的格式不了解,所以就比较云头转向,正好看到了一篇讲述flv文件格式的文章,写的比较明白,所以就转过来了.O(∩_∩) ...

  2. [西瓜书习题] 第二章 模型评估与选择

    2.1 数据集包含1000个样本,其中500个正例,500个反例,将其划分为包含70%样本的训练集和30%样本的测试集用于留出法评估,试估算共有多少种划分方式. 留出法将数据集划分为两个互斥的集合,为 ...

  3. Lesson 14.1 数据归一化与Batch Normalization理论基础

    Lesson 14.1 数据归一化与Batch Normalization理论基础   数据归一化是机器学习领域的一种对数据处理的常规方式.在传统机器学习领域,由于各特征的量纲不一致,可能出现建模过程 ...

  4. 实现机器学习的循序渐进指南I——KNN

    目录 介绍 KNN模型 距离计算 选择K 分类 结论与分析 可访问 实现机器学习的循序渐进指南系列汇总,获取本系列完成文章列表. 介绍 K-最近邻(KNN)是一种简单的机器学习算法,其原理是计算测试对 ...

  5. Kaggle Lending Club Loan Data数据可视化分析与不良贷款预测

    文章目录 数据集介绍 数据可视化分析前的数据预处理 引入包和数据集 对特征缺失值的处理 保存处理好的数据集 数据可视化分析 申请贷款金额和实际贷款金额的数据分布 每年贷款笔数直方图与每年贷款总金额直方 ...

  6. 机器学习之为什么要数据预处理?如何预处理数据?

    在现实生活问题中,我们得到的原始数据往往非常混乱.不全面,机器学习模型往往无法从中有效识别并提取信息.数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已,在采集完数据后,机器学习建模的首 ...

  7. 吴恩达机器学习课程笔记一

    吴恩达机器学习课程笔记 前言 监督学习---`Supervised learning` 无监督学习---`Unsupervised learning` 聚类 异常检测 降维 增强学习---`Reinf ...

  8. 机器学习-周志华-课后习题-模型选择与评估

    文中提到,在机器学习的过程中,过拟合总是无法彻底避免的.其中,关于P与NP的论述,个人理解为:对于一个有效的算法,它一定要在多项式时间内运行完成.此时,算法可以恰当程度地学习到所需要的知识,也就是说既 ...

  9. 数据分析之数据处理(四)

    数据分析之数据处理(四) 一.数据归一化/标准化 数据的标准化是数据按比例缩放,使之落入一个小的特定区间.在某些比较和评论的指标处理汇总京城会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不 ...

  10. PythonStudy4

    文章目录 一.前言 二.归一化 1. 概念 2. 方法 3. 归一化代码 三.训练 四.其他算法 五.总结 一.前言 无论怎么选择数据特征都难以得到一个高的分类率. 最后在看方差和标准差的时候, 发现 ...

最新文章

  1. 八种Docker容器开发模式解析
  2. sql between...and 用法(mysql)
  3. js实战代码系列—周杰伦给你报时间+网页页签制作模板+jQuery初体验
  4. 前端特效demo | 一起围观 10 种创意时钟
  5. 【原】linux下tar解压缩问题:time stamp in the future
  6. 【LeetCode】【字符串】题号:*344. 反转字符串
  7. 《一本书读懂中国税》- 笔记
  8. 企业信息化规划与设计
  9. 华为HCDA论证教程
  10. “海天”们推新、“饭爷”们加速;调味料升级战谁能突围?
  11. 以指标驱动业务决策,Kyligence 亮相 Gartner IT Symposium/Xpo™ 峰会
  12. 一文带你了解移动入库指南(详细版)
  13. python一元二次方程组
  14. ToggleButton的学习与使用
  15. stc 串口收发 c语言,STC12C5A60S2 串口中断接收程序
  16. 关于抓java的dump中live参数
  17. python识别中文人名_中文人名识别
  18. 小技巧:absolute 元素的宽度问题
  19. 2021. 03. 04俱乐部月赛
  20. 基于vue前端ui_基于Vue的hydrusrv前端

热门文章

  1. JS的作用域和作用域链
  2. Log_Analysis_using_OSSEC.md
  3. 最让人心动的十大互联网界广告语+超笑评语
  4. oracle 中的角色
  5. c语言的数组长度问题
  6. 颜色空间——Gamma与线性颜色空间
  7. 无法远程连接SQLSERVER2000的解决方法
  8. 安卓listview控件使用
  9. 艺术签名设计软件3.0汉化破解版 软件下载
  10. Asp.net 2.0 自定义控件开发[实现自动计算功能(AutoComputeControl)][示例代码下载][续]...