大数据分析中许多情况下需要用到矩阵标准化(使该矩阵每一列的平均值为0,标准差为1)

Here is the formula: (X-mean())/std()

以上运算是按列进行的,因为通常大数据分析中的矩阵X N*M,其中每一行代表一个数据,而列代表不同的性质,既是N个数据,每个数据有M种性质

应用:

假设现在已经有一个.npy元数据文件,我们打算用numpy来将它标准化,于是首先将其load进来,然后分别计算mean和std,如下:

import numpy as npX = np.load('data.npy')X-=np.mean(X,axis=0)X/=np.std(X,axis=0)

有必要解释一下numpy中的这两个函数

np.mean(X,axis=0) 表示按列求X的平均值,axis=0表示按列进行

np.std(X,axis=0) 表示按列求X的标准差,axis=0表示按列进行

关于这两个函数的用法和参数,详见这里https://docs.scipy.org/doc/numpy/reference/generated/numpy.std.html

于是现在便得到了X的标准化矩阵了

当然我们之后还能将它显示出来,将矩阵生成图形之后,plt.show()显示图形即可

初学数据分析(一)【利用numpy实现矩阵标准化】相关推荐

  1. python np array归一化_浅谈利用numpy对矩阵进行归一化处理的方法

    浅谈利用numpy对矩阵进行归一化处理的方法 本文不讲归一化原理,只介绍实现(事实上看了代码就会懂原理),代码如下: def Normalize(data): m = np.mean(data) mx ...

  2. 利用 Numpy 进行矩阵相关运算

    正文共:3266 字 31 图 预计阅读时间: 9 分钟 本文目录: 1. 前言 1.1 基本介绍 1.2 运行环境 2. 函数清单 3. 案例讲解 3.1 Numpy.linalg 3.2 Nump ...

  3. 利用numpy对矩阵进行归一化处理的方法

    本文不讲归一化原理,只介绍实现(事实上看了代码就会懂原理),代码如下: def Normalize(data):m = np.mean(data)mx = max(data)mn = min(data ...

  4. Python 数据分析三剑客之 NumPy(六):矩阵 / 线性代数库与 IO 操作

    CSDN 课程推荐:<Python 数据分析与挖掘>,讲师刘顺祥,浙江工商大学统计学硕士,数据分析师,曾担任唯品会大数据部担任数据分析师一职,负责支付环节的数据分析业务.曾与联想.亨氏.网 ...

  5. 利用R与NumPy实现矩阵乘法

    利用R与NumPy实现矩阵乘法 一.R矩阵乘法 1.A*B--逐项相乘 2.A%*%B--矩阵相乘 3.crossprod(A, B)--A'%*%B(A':A的转置矩阵)--交叉相乘 二.NumPy ...

  6. Python中利用numpy将数组(矩阵)存成csv文件,将csv文件读取为数组(矩阵)

    Python中利用numpy将数组(矩阵)存成csv文件,将csv文件读取为数组(矩阵) 本博客转载自:https://blog.csdn.net/vernice/article/details/50 ...

  7. Python 数据分析三剑客之 NumPy(五):数学 / 算术 / 统计 / 排序 / 条件 / 判断函数合集

    CSDN 课程推荐:<Python 数据分析与挖掘>,讲师刘顺祥,浙江工商大学统计学硕士,数据分析师,曾担任唯品会大数据部担任数据分析师一职,负责支付环节的数据分析业务.曾与联想.亨氏.网 ...

  8. Python 数据分析三剑客之 NumPy(二):数组索引 / 切片 / 广播 / 拼接 / 分割

    CSDN 课程推荐:<Python 数据分析与挖掘>,讲师刘顺祥,浙江工商大学统计学硕士,数据分析师,曾担任唯品会大数据部担任数据分析师一职,负责支付环节的数据分析业务.曾与联想.亨氏.网 ...

  9. DL之DNN:利用numpy自定义三层结构+softmax函数建立3层完整神经网络全部代码实现(探究BP神经网络的底层思想)

    DL之DNN:利用numpy自定义三层结构+softmax函数建立3层完整神经网络全部代码实现(探究BP神经网络的底层思想) 目录 输出结果 代码实现 输出结果 代码实现 #DL之NN:利用numpy ...

  10. numpy找到矩阵中不同元素的种类_基于NumPy和图像分类的人工神经网络构建

    基于NumPy和图像分类的人工神经网络构建 本文利用NumPy系统在Python中构建人工神经网络,以便为Fruits360数据集执行图像分类应用程序. 本文提及的所有内容(即图像和源代码,不包括Fr ...

最新文章

  1. 登陆sqlserver及修改端口号
  2. 伪mac android,Mac,android sdk,monkey压力测试,真机
  3. C# WebAPI设置跨域
  4. JSP引入CSS文件无法生效的问题
  5. js判断浏览器是否支持flash的方法
  6. BGP 路由属性 公认可选 LOCAL_PREF
  7. atitit.跨语言执行cmd cli api的原理及兼容性设计草案
  8. 代码 or 指令,浅析ARM架构下的函数的调用过程
  9. Poj1995--Raising Modulo Numbers(快速幂)
  10. 第十一讲 在ASP.NET中使用用户控件
  11. PID控制算法+倒立摆控制应用
  12. LINGO--Error Code 1017
  13. db4o_8.0对象数据库官方文档翻译_学习笔记四
  14. 2022年危险化学品经营单位安全管理人员考试练习题及模拟考试
  15. 电信校园招聘计算机笔试,中国电信校园招聘笔试试题
  16. 使用hifiasm组装hifi基因组的方法介绍
  17. Android学习——5个UI界面设计
  18. java中的集合详解
  19. 人脸检测:RetinaFace(开源简化版)详细解读
  20. 关于工作与生活——HP大中华区总裁孙振耀撰文谈退休并畅谈人生

热门文章

  1. 人工智能NLP项目_深度学习和神经网络(1)
  2. win10更新完,每次重启电脑都提示 未安装任何音频输出设备
  3. itextpdf处理PDF,用文本域的方式
  4. 我国CN域名一年减少600万个 全要求实名注册
  5. 向量运算(点积,叉积)
  6. linux文件系统修复
  7. 使用 DISM 工具检查并修复 Windows 系统文件
  8. openalyers 好玩的效果之蒙版图层
  9. 26 | Superscalar和VLIW:如何让CPU的吞吐率超过1?
  10. 北京等保测评机构项目测评收费价格标准参考