在机器学习过程中,对数据的处理过程中,常常需要对数据进行归一化处理,下面介绍(0, 1)标准化的方式,简单的说,其功能就是将预处理的数据的数值范围按一定关系“压缩”到(0,1)的范围类。
通常(0, 1)标注化处理的公式为:
xnormalization=x−MinMax−Min{x}_{normalization}=\frac{x-Min}{Max-Min} xnormalization​=Max−Minx−Min​,即将样本点的数值减去最小值,再除以样本点数值最大与最小的差,原理公式就是这么基础。
下面看看使用python语言来编程实现吧

import numpy as np
import matplotlib.pyplot as pltdef noramlization(data):minVals = data.min(0)maxVals = data.max(0)ranges = maxVals - minValsnormData = np.zeros(np.shape(data))m = data.shape[0]normData = data - np.tile(minVals, (m, 1))normData = normData/np.tile(ranges, (m, 1))return normData, ranges, minValsx = np.array([[78434.0829, 26829.86612], [78960.4042, 26855.13451], [72997.8308, 26543.79201],[74160.2849, 26499.56629], [75908.5746, 26220.11996], [74880.6989, 26196.03995],[74604.7169, 27096.87862], [79547.6796, 25986.68579], [74997.7791, 24021.50132],[74487.4915, 26040.18441], [77134.2636, 24647.274],   [74975.2792, 24067.31441],[76013.5305, 24566.02273], [79191.518,  26840.29867], [80653.4589, 25937.22248],[79185.9935, 26996.18228], [74426.881,  24227.71439], [73246.4295, 26561.59268],[77963.1478, 25580.05298], [74469.8778, 26082.15448], [81372.3787, 26649.69232],[76826.8262, 24549.77367], [77774.2608, 25999.96037], [79673.1361, 25229.04353],[75251.7951, 24902.72185], [78458.073,  23924.15117], [82247.5439, 29671.33493],[82041.2247, 27903.34268], [80083.2029, 28692.35517], [80962.0043, 28519.81002],[79799.8328, 28740.27736], [80743.9947, 28862.75402], [80888.449,  29724.53706],[81768.4638, 30180.20618], [80283.8783, 30417.55057], [79460.7078, 29092.52867],[75514.1202, 28071.73721], [80595.5945, 30292.25917], [80750.4876, 29651.32254],[80020.662,  30023.70025], [82992.3395, 29466.83067], [80185.5946, 29943.15481],[81854.6163, 29846.18257], [81526.4017, 30218.27078], [79174.5312, 29960.69999],[78112.3051, 26467.57545], [80262.4121, 29340.23218], [81284.9734, 28257.71529],[81928.9905, 28752.84811], [80739.2727, 29288.85126], [83135.3435, 30223.4974],[83131.8223, 29049.10112], [82549.9076, 28910.15209], [81574.0822, 28326.55367],[80507.399,  28553.56851], [82956.2103, 29157.62372], [81909.7132, 29359.24497],[80893.5603, 29326.64155], [82520.1272, 30424.96703], [82829.8548, 31062.24418],[80532.1495, 29198.10407], [80112.7963, 29143.47905], [81175.0882, 28443.10574]])newgroup, _, _ = noramlization(x)
newdata = newgroup
plt.scatter(x[:, 0], x[:, 1], marker='*', c='r', s=24)
plt.show()
print(len(x[:, 0]))
print(len(x[:, 1]))
print(newdata)

将数据进行归一化处理后,并使用matplotlib绘制出处理后的散点图分布如下:

可以看到数据的数值范围均为(0,1)之间了

python实现数据归一化处理的方式:(0,1)标准化相关推荐

  1. python归一化处理_详解python实现数据归一化处理的方式:(0,1)标准化

    在机器学习过程中,对数据的处理过程中,常常需要对数据进行归一化处理,下面介绍(0, 1)标准化的方式,简单的说,其功能就是将预处理的数据的数值范围按一定关系"压缩"到(0,1)的范 ...

  2. python归一化后全部都是0咋办_详解python实现数据归一化处理的方式:(0,1)标准化...

    在机器学习过程中,对数据的处理过程中,常常需要对数据进行归一化处理,下面介绍(0, 1)标准化的方式,简单的说,其功能就是将预处理的数据的数值范围按一定关系"压缩"到(0,1)的范 ...

  3. python 归一化处理_详解python实现数据归一化处理的方式:(0,1)标准化

    在机器学习过程中,对数据的处理过程中,常常需要对数据进行归一化处理,下面介绍(0, 1)标准化的方式,简单的说,其功能就是将预处理的数据的数值范围按一定关系"压缩"到(0,1)的范 ...

  4. python怎么数据归一化_基于数据归一化以及Python实现方式

    数据归一化: 数据的标准化是将数据按比例缩放,使之落入一个小的特定区间,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权. 为什么要做归一化: 1)加快梯度下降 ...

  5. Python 实现数据归一化处理

    字符类型不能归一化... 数据处理经常要用到归一化处理,使各项指数的尺度达到统一,python中实现数据归一化处理的代码如下: #准备工作:安装numpy.pandas包,csv文件转为数值型,之后修 ...

  6. python怎么数据归一化_python数据归一化及三种方法详解

    数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可 ...

  7. python 处理数据归一化

    数据规范化 为了消除指标之间的量纲和取值范围差异的影响,需要进行标准化(归一化)处理,将数据按照比例进行缩放,使之落入一个特定的区域,便于进行综合分析.数据规范化方法主要有: - 最小-最大规范化 - ...

  8. python 音频数据归一化

    import copy import numpy as np from scipy.io import wavfile import matplotlib.pyplot as pltfs, data ...

  9. python 数据归一化_python 实现对数据集的归一化的方法(0-1之间)

    python 实现对数据集的归一化的方法(0-1之间) 多数情况下,需要对数据集进行归一化处理,再对数据进行分析 #首先,引入两个库 ,numpy,sklearn from sklearn.prepr ...

最新文章

  1. oracle数据如何获取游标中动态字段_如何实现报表数据的动态层次钻取(二)
  2. 802.11n 连接的建议设置是什么?
  3. System.Data.SqlClient.SqlException:“对象名 'customer' 无效。
  4. 北京奥运会闭幕式落下帷幕
  5. iOS经典面试题之深入分析block相关高频面试题
  6. kali设置中文_kali安装教程
  7. android retrofit 2.0,android – Retrofit 2.0 OnFailure – 原始响应
  8. 最后的代课老师———漆红玉[转]
  9. 如何动态改变Table Control的列抬头
  10. 3.8 Softmax 回归
  11. javascript鼠标滚轮滚动实现模块的伸缩功能
  12. dentry path_lookat dput
  13. unity遇到的问题
  14. java 大写中文金额 转 数字
  15. 在线预览pdf(不可下载)
  16. 基于 electron 实现简单易用的抓包、mock 工具
  17. 三、appender分析
  18. 2020年下半年系统集成项目管理资料、精心整理
  19. 基于curl 的zabbix API调用
  20. 产品取名——中国IT产品命名奇观

热门文章

  1. c语言综合作业题库,计算机二级等级考试《C语言》选择题专项练习合集
  2. 音频工具 Adobe Audition
  3. MacBook下postgresql启动失败的解决方案
  4. VS2019运行缺少MSVCP110D 和MSVCR110D的解决办法
  5. CoreOS发布开源容器漏洞分析工具Clair
  6. 蓝牙耳机什么牌子适合新手?选购不踩雷最强攻略,2021蓝牙耳机分享
  7. Unity中用到的C#补充(七)- 委托与事件
  8. 基于Android的掌上校园应用设计与实现(论文+程序源码+ppt答辩)
  9. 基于Socket编程的聊天工具【Java实现】
  10. jpg图片转ico图片格式