标准化

去均值,方差规模化

数据分析的过程中,比如线性规划这一类的分析,如果有些特征的数值远远高于或低于其他数值,通常称之为独立点、异常值或噪点,那么对于受噪点影响较大的模型就无法正确地去学习其他特征。

Standardization标准化:将特征数据的分布调整成标准正太分布,也叫高斯分布,过程为两步:去均值的中心化(均值变为0);方差的规模化(方差变为1)。
在sklearn.preprocessing中有一个scale方法,可以实现数据标准化,该方法默认按照列进行标准化。

from sklearn import preprocessing
import numpy as npx = np.array([[1., -1., 2., 3.],[2., 0., 0., -2],[0., 1., -1., 0],[1., 2., -3., 1]])print("标准化之前的方差:", x.mean(axis=0))
print("标准化之前的标准差:", x.std(axis=0))#标准化
x_scale = preprocessing.scale(x)
print("\n------------------\n标准化结果:\n", x_scale)
print("\n标准化之后的方差:", x_scale.mean(axis=0))
print("标准化之后的标准差:", x_scale.std(axis=0))
运行结果:

标准化之前的方差: [ 1. 0.5 -0.5 0.5]
标准化之前的标准差: [0.70710678 1.11803399 1.80277564 1.80277564]

标准化结果:
[[ 0. -1.34164079 1.38675049 1.38675049]
[ 1.41421356 -0.4472136 0.2773501 -1.38675049]
[-1.41421356 0.4472136 -0.2773501 -0.2773501 ]
[ 0. 1.34164079 -1.38675049 0.2773501 ]]

标准化之后的方差: [0. 0. 0. 0.]
标准化之后的标准差: [1. 1. 1. 1.]

数据归一化 MinMaxScaler()/MaxAbsScaler() 文章链接

数据标准化 - scale() - Python代码相关推荐

  1. 机器学习之信用卡欺诈检测(零基础,附数据及详细python代码2022年Tensorflow2)

    首先该数据参考:机器学习项目实战之信用卡欺诈检测(零基础,附数据及详细python代码) (4条消息) 机器学习项目实战之信用卡欺诈检测(零基础,附数据及详细python代码)_西南交大-Liu_z的 ...

  2. UN Comtrade(联合国商品贸易统计数据库)数据爬取Python代码

    目录 Python代码 根据需求改写url 报错应对办法 UN Comtrade数据库关于中国台湾的数据 2021/9/28更新:最近有用户反馈下载会出现错误内容如下图,感谢用户@三眼皮138帮忙找出 ...

  3. UN Comtrade(联合国商品贸易统计数据库)数据爬取Python代码——使用动态IP

    目录 Virtual Private Network 代理服务器 测试代理IP是否生效 上一篇博文UN Comtrade(联合国商品贸易统计数据库)数据爬取Python代码讲了如何使用Python爬取 ...

  4. Excel:快速合并多张表格或多个文件(工作簿)的数据(附Python代码)

    Excel:快速合并多张表格或多个文件(工作簿)的数据(附Python代码) 现实工作中经常遇到将零散的原始数据合并统计的工作要求,如月度统计或年度统计等.原始数据的收集大多是按时间(如日期或小时)进 ...

  5. Z-score标准化的python代码

    部分代码如下 import numpy as np import pandas as pd import xlrd import xlwt from numpy import ravel from x ...

  6. python代码实现中心化_数据预处理——标准化(附python代码)

    数据标准化,是数据清洗的重要环节之一.主要目的是消除"量纲"和"不同规模"的影响,使其所放到相同的数据区间和范围,以减少规模.特征.分布差异等对数据模型的影响. ...

  7. python输入三行数据_3行Python代码就能获取海量数据?

    原标题:3行Python代码就能获取海量数据? 一谈起数据分析,首先想到的就是数据,没有数据,谈何分析. 毕竟好的菜肴,没有好的原材料,是很难做的- 所以本期小F就给大家分享一个获取数据的方法,只需三 ...

  8. python标准化_数据标准化与Python实现

    一.原理 数据标准化(Normalization):将数据按照一定比例进行缩放,使其落入到一个特定的小区间. 数据标准化的类别: Min-Max标准化 Z-Score标准化(Standard Scor ...

  9. python画带状图_13个使用Matplotlib实现数据可视化的Python代码

    和文字说明相比,清晰直观的图形更能令人印象深刻.一目了然.数据可视化对于做数据分析非常的有帮助,不管是人工智能,还是机器学习,都需要数据可视化. 在Python中,有一个2D绘图库Matplotlib ...

最新文章

  1. 使用VS2005进行代码覆盖率分析
  2. 延期毕业,只因实验用的鱼被野猫偷吃了………
  3. 卡耐基梅隆计算机学院,卡内基梅隆计算机学院--计算机系简介
  4. CS229 6.18 CNN 的反向传导算法
  5. RHEL6.1在字符模式下安装图形界面
  6. 6 键盘高级操作技巧
  7. 云计算的发展趋势_云计算的未来发展趋势
  8. 论文阅读笔记(十五)——黑猩猩在野外的脸:用于预测灵长类身份和属性的对数欧几里得CNN
  9. 连续获两家乘用车前向定点, 又一家国产毫米波雷达企业欲“赶超”外资巨头
  10. 大革命修改后无法连接服务器,刺客信条大革命常见问题解决方法 中文设置教学...
  11. 更换yum源-阿里yum源
  12. android studio 文件名颜色 灰色,绿色,红色,蓝色,白色的含义
  13. python对数正态分布函数_Lognormal Distribution对数正态分布
  14. 转一篇Java基础的文章,比较有深度的,就转来收藏了
  15. 信息安全三要素CIA
  16. Pandas学习(二)—— Pandas基础
  17. C#获取动态key的json对象的值
  18. 企业域名是什么?域名代表网站流量
  19. 讯飞语音识别之语音转文字------java
  20. vue - vue的配置文件vue.config.js介绍

热门文章

  1. Vim直接打开Tampermonkey网址的方法。
  2. laravel方法汇总详解
  3. 解决VirtualBox错误:“FATAL:No bootable medium found!”
  4. 开始学习ZendFramework框架了
  5. 排序算法之希尔排序(Java)
  6. 利用qsort二级排序
  7. python 数据分析 实际案例_python实战案例:超市营业额数据分析
  8. 复习Java_List_Set_HashSet原理_Collections使用_Comparator使用
  9. AttributeError: ‘set‘ object has no attribute ‘items‘
  10. 属于python应用领域的有数据可视化_Python数据可视化