常见的数据归一化方法

min-max标准化(Min-max normalization)/0-1标准化(0-1 normalization)

也叫离差标准化,是对原始数据的线性变换,使结果落到[0,1]区间,转换函数如下:

其中max为样本数据的最大值,min为样本数据的最小值。

def Normalization(x):
    return [(float(i)-min(x))/float(max(x)-min(x)) for i in x]

如果想要将数据映射到[-1,1],则将公式换成:

x∗=x−xmean/xmax−xmin

x_mean表示数据的均值。

def Normalization2(x):
    return [(float(i)-np.mean(x))/(max(x)-min(x)) for i in x]

这种方法有一个缺陷就是当有新数据加入时,可能导致max和min的变化,需要重新定义。

log函数转换

通过以10为底的log函数转换的方法同样可以实现归一下,具体方法如下:

看了下网上很多介绍都是x*=log10(x),其实是有问题的,这个结果并非一定落到[0,1]区间上,应该还要除以log10(max),max为样本数据最大值,并且所有的数据都要大于等于1。

常见数据归一化的几种方法相关推荐

  1. 数据归一化及三种方法(python)

    数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可 ...

  2. python怎么数据归一化_python数据归一化及三种方法详解

    数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可 ...

  3. 归一化mysql函数_数据归一化和两种常用的归一化方法

    数据归一化和两种常用的归一化方法 一.总结 一句话总结: min-max标准化:x* =(x-min)/(max-min):新数据加入,需重新计算max和min Z-score标准化:x* =(x-μ ...

  4. python预处理标准化_tensorflow预处理:数据标准化的几种方法

    tensorflow预处理:数据标准化的几种方法 发布时间:2018-08-09 19:39, 浏览次数:1774 , 标签: tensorflow 数据归一化问题是数据挖掘中特征向量表达时的重要问题 ...

  5. 数据增加的两种方法(二)

    数据增加的两种方法(二) 开发工具与关键技术:SQL Server 2014.数据增加的两种方法(二) 作者:袁何恩 撰写时间:2019年7月26日 今天,我要和大家分享的技术是新增数据的两种方法. ...

  6. 用于处理机器学习大数据文件的7种方法

    机器学习数据文件太大而不能装入内存数据集是很常见的. 这会导致以下问题: 如何加载多个G的数据文件? 当我尝试运行我的数据集时算法崩溃;我该怎么办? 您能帮助纠正内存不足的错误吗? 在这篇文章中,我想 ...

  7. python与excel做数据可视化-用Python进行数据可视化的10种方法

    原标题:用Python进行数据可视化的10种方法 2015-11-19 关于转载授权 大数据文摘作品,欢迎个人转发朋友圈,自媒体.媒体.机构转载务必申请授权,后台留言"机构名称+转载&quo ...

  8. WPF中在XAML中实现数据类型转换的两种方法

    WPF中在XAML中实现数据类型转换的两种方法 原文:WPF中在XAML中实现数据类型转换的两种方法 熟悉数据绑定的朋友都知道,当我们在Model中获取一个对象的数据,常常需要对其进行数据转换后显示在 ...

  9. Python 数据降噪处理的四种方法——均值滤波、小波变换、奇异值分解、改变binSize

    Python 数据降噪处理的四种方法--均值滤波.小波变换.奇异值分解.改变binSize github主页:https://github.com/Taot-chen 一.均值滤波 1)算法思想 给定 ...

最新文章

  1. matlab去除图片水印_Python利用OpenCV去除图片水印
  2. c# webBrowser打开pdf问题
  3. java 处理表单_java – 处理multipart / form-data输入
  4. oracle ORA-14452错误处理
  5. CDN关键技术研究与应用—内容路由技术
  6. java8中方法区的内存大小如何设置_从Java8升级到Java11
  7. css的属性是变量是怎么表达,CSS自定义变量属性——像less,sass那样在css中使用变量(译)...
  8. mall商城 -小程序,h5和pc vue前后端分离
  9. 手机秒变门禁卡,支持加密卡
  10. Java中的retainAll()函数笔记
  11. 考研复试数据库原理课后习题(一)——绪论
  12. 关于计算机的论文英语2000字,英语论文2000字左右
  13. 网页图片+文字并排显示效果
  14. LINUX IIO子系统分析之二 IIO子系统相关数据结构分析
  15. 集群通信TIPC协议
  16. 批处理修改计算机名为ip,批处理修改计算机名和IP地址
  17. 键盘连不上计算机,电脑键盘连接不上电脑是怎么回事
  18. 祝福我的家人朋友永远平安健康
  19. 2022电工(中级)操作证考试题库及模拟考试
  20. 实力领航|万应智谷云平台成功入选2022中国互联网大会“互联网助力经济社会数字化转型”特色案例

热门文章

  1. Linux Ubuntu常用命令
  2. 滑模控制中消除抖振的本质
  3. 华章数学译丛目录(2020年7月补缺更新版,共73本)
  4. 【模糊数学】模糊逻辑,隶属度,模糊逻辑应用,模糊推理过程
  5. MVC模式和文档/视图结构
  6. 64 os 驱动签名
  7. weka: naive bayes
  8. 深圳市灯谜学会的近三百条“深圳原创灯谜”引的市民激智抢麦
  9. Spark内核以及源码解析
  10. 结合keepalived实现redis群集高可用故障自动切换