常见数据归一化的几种方法
常见的数据归一化方法
min-max标准化(Min-max normalization)/0-1标准化(0-1 normalization)
也叫离差标准化,是对原始数据的线性变换,使结果落到[0,1]区间,转换函数如下:
其中max为样本数据的最大值,min为样本数据的最小值。
def Normalization(x):
return [(float(i)-min(x))/float(max(x)-min(x)) for i in x]
如果想要将数据映射到[-1,1],则将公式换成:
x∗=x−xmean/xmax−xmin
x_mean表示数据的均值。
def Normalization2(x):
return [(float(i)-np.mean(x))/(max(x)-min(x)) for i in x]
这种方法有一个缺陷就是当有新数据加入时,可能导致max和min的变化,需要重新定义。
log函数转换
通过以10为底的log函数转换的方法同样可以实现归一下,具体方法如下:
看了下网上很多介绍都是x*=log10(x),其实是有问题的,这个结果并非一定落到[0,1]区间上,应该还要除以log10(max),max为样本数据最大值,并且所有的数据都要大于等于1。
常见数据归一化的几种方法相关推荐
- 数据归一化及三种方法(python)
数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可 ...
- python怎么数据归一化_python数据归一化及三种方法详解
数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可 ...
- 归一化mysql函数_数据归一化和两种常用的归一化方法
数据归一化和两种常用的归一化方法 一.总结 一句话总结: min-max标准化:x* =(x-min)/(max-min):新数据加入,需重新计算max和min Z-score标准化:x* =(x-μ ...
- python预处理标准化_tensorflow预处理:数据标准化的几种方法
tensorflow预处理:数据标准化的几种方法 发布时间:2018-08-09 19:39, 浏览次数:1774 , 标签: tensorflow 数据归一化问题是数据挖掘中特征向量表达时的重要问题 ...
- 数据增加的两种方法(二)
数据增加的两种方法(二) 开发工具与关键技术:SQL Server 2014.数据增加的两种方法(二) 作者:袁何恩 撰写时间:2019年7月26日 今天,我要和大家分享的技术是新增数据的两种方法. ...
- 用于处理机器学习大数据文件的7种方法
机器学习数据文件太大而不能装入内存数据集是很常见的. 这会导致以下问题: 如何加载多个G的数据文件? 当我尝试运行我的数据集时算法崩溃;我该怎么办? 您能帮助纠正内存不足的错误吗? 在这篇文章中,我想 ...
- python与excel做数据可视化-用Python进行数据可视化的10种方法
原标题:用Python进行数据可视化的10种方法 2015-11-19 关于转载授权 大数据文摘作品,欢迎个人转发朋友圈,自媒体.媒体.机构转载务必申请授权,后台留言"机构名称+转载&quo ...
- WPF中在XAML中实现数据类型转换的两种方法
WPF中在XAML中实现数据类型转换的两种方法 原文:WPF中在XAML中实现数据类型转换的两种方法 熟悉数据绑定的朋友都知道,当我们在Model中获取一个对象的数据,常常需要对其进行数据转换后显示在 ...
- Python 数据降噪处理的四种方法——均值滤波、小波变换、奇异值分解、改变binSize
Python 数据降噪处理的四种方法--均值滤波.小波变换.奇异值分解.改变binSize github主页:https://github.com/Taot-chen 一.均值滤波 1)算法思想 给定 ...
最新文章
- matlab去除图片水印_Python利用OpenCV去除图片水印
- c# webBrowser打开pdf问题
- java 处理表单_java – 处理multipart / form-data输入
- oracle ORA-14452错误处理
- CDN关键技术研究与应用—内容路由技术
- java8中方法区的内存大小如何设置_从Java8升级到Java11
- css的属性是变量是怎么表达,CSS自定义变量属性——像less,sass那样在css中使用变量(译)...
- mall商城 -小程序,h5和pc vue前后端分离
- 手机秒变门禁卡,支持加密卡
- Java中的retainAll()函数笔记
- 考研复试数据库原理课后习题(一)——绪论
- 关于计算机的论文英语2000字,英语论文2000字左右
- 网页图片+文字并排显示效果
- LINUX IIO子系统分析之二 IIO子系统相关数据结构分析
- 集群通信TIPC协议
- 批处理修改计算机名为ip,批处理修改计算机名和IP地址
- 键盘连不上计算机,电脑键盘连接不上电脑是怎么回事
- 祝福我的家人朋友永远平安健康
- 2022电工(中级)操作证考试题库及模拟考试
- 实力领航|万应智谷云平台成功入选2022中国互联网大会“互联网助力经济社会数字化转型”特色案例