文章目录

  • scale
  • MinMaxScaler

scale

from sklearn.preprocessing import scale

Center to the mean and component wise scale to unit variance.

很简单,用均值和标准差来进行数据标准化。(注意,这里的标准差就是样本标准差,而不是那个无偏的总体标准差)

x′=x−x^σx^{'}=\frac{x-\hat{x}}{\sigma}x′=σx−x^​

其实这个标准化有的地方也叫做z-标准化。

a=[1,2]
print(scale(a))
(a-np.mean(a))/np.std(a)#也就是这个公式。

MinMaxScaler

from sklearn.preprocessing import MinMaxScaler
a=np.arange(4).reshape(2,2)
a

tool = MinMaxScaler(feature_range=(-1, 1))
tool.fit_transform(a)


解释:

  1. 按列进行min-max标准化。可以得到第一列为0,1,第二列也为0,1。注意,min-max标准化的结果都一定是在[0,1]之间的。
  2. 由于提供了feature_range=(-1, 1),所以需要将1中的结果先进行放缩,这里是1–1=2,所以需要放大2倍,成为(0,2),此时区间长度和(-1,1)一样,然后向左平移即可。

sklearn.preprocessing下的数据标准化(scale、MinMaxScaler)相关推荐

  1. pandas 下的 one hot encoder 及 pd.get_dummies() 与 sklearn.preprocessing 下的 OneHotEncoder 的区别

    sklearn.preprocessing 下除了提供 OneHotEncoder 还提供 LabelEncoder(简单地将 categorical labels 转换为不同的数字): 1. 简单区 ...

  2. 数据标准化 - scale() - Python代码

    标准化 去均值,方差规模化 数据分析的过程中,比如线性规划这一类的分析,如果有些特征的数值远远高于或低于其他数值,通常称之为独立点.异常值或噪点,那么对于受噪点影响较大的模型就无法正确地去学习其他特征 ...

  3. Sklearn——对数据标准化(Normalization)

    文章目录 1.前言 2.数据标准化 3.对比标准化前后 3.1.数据标准化前 3.2.数据标准化后 1.前言 由于数据的偏差与跨度会影响机器学习的成效,因此正规化(标准化)数据可以提升机器学习的成效 ...

  4. 特征工程中的数据标准化

    数据标准化 数据标准化主要用来消除不同特征之间的量纲的影响,量纲指的是特征的计量单位,如果特征的单位不一致,那么不同的特征不能放在一起去比较.例如在日常生活中,身高的单位时cm,体重的单位时kg,二者 ...

  5. K-Means聚类分析广告投放效果的改进(数据标准化、最佳K值的确定)

    业务场景: 甲公司投放广告的渠道很多,每个渠道的客户性质也可能不同,比如在优酷视频投广告和今日头条投放广告,效果可能会有差异.现在需要对广告效果分析实现有针对性的广告效果测量和优化工作. 1 导入相关 ...

  6. python归一化sklearn_用sklearn进行对数据标准化、归一化以及将数据还原详解

    如何用sklearn进行对数据标准化.归一化以及将数据还原 在对模型训练时,为了让模型尽快收敛,一件常做的事情就是对数据进行预处理. 这里通过使用sklearn.preprocess模块进行处理. 一 ...

  7. python实现数据恢复_使用sklearn进行对数据标准化、归一化以及将数据还原的方法...

    在对模型训练时,为了让模型尽快收敛,一件常做的事情就是对数据进行预处理. 这里通过使用sklearn.preprocess模块进行处理. 一.标准化和归一化的区别 归一化其实就是标准化的一种方式,只不 ...

  8. sklearn.preprocessing之数据预处理

    sklearn.preprocessing 提供了多个数据预处理类和方法,将原始特征向量转换为更适合于下游模型的表示. Standardization 标准化是列处理,对不同样本的同一个属性值进行标准 ...

  9. 使用sklearn进行对数据标准化、归一化以及将数据还原

    在对模型训练时,为了让模型尽快收敛,一件常做的事情就是对数据进行预处理. 这里通过使用sklearn.preprocess模块进行处理. 一.标准化和归一化的区别 归一化其实就是标准化的一种方式,只不 ...

最新文章

  1. css3 动画 火箭,CSS3 火箭发射动画 寓意创新起航
  2. python3 - 元组、集合
  3. 【周报6.10-6.16】NLP,RL,GAN,DL框架等重磅专栏齐上线,这个月的有三AI你值得拥有...
  4. boost::mpl::always相关用法的测试程序
  5. javascript 正则表达式-零宽断言
  6. 47.leetcode36_valid_suduko
  7. python收取wss数据_大宗商品现货数据不好拿?商品季节性难跟踪?Python爬虫一键解决没烦恼...
  8. axure数据报表元件库_axure图表元件库 axure教程:如何制作axure组件库
  9. selenium 接管浏览器
  10. 题目 1040: 实数的打印
  11. 消息队列的优点和缺点
  12. 【沧小海笔记】之基于FPGA的以太网设计相关知识——第一章 互联网概述
  13. 【Red Team——基础】通过钓鱼攻击获得访问权限
  14. 极视角与山东港口科技集团青岛有限公司共建「AI 赋能智慧港口联合实验室」
  15. 交换机与路由器工作原理
  16. <Linux开发>--驱动开发-- 字符设备驱动(3) 过程详细记录
  17. STM32定时器实现100毫秒保存一次数据到SD卡
  18. python3解两数之和
  19. 倍福EK1110模块介绍
  20. 抖音测试像哪个明星的软件,抖音中的测测你像哪位明星特效如何拍摄

热门文章

  1. 智源首席科学家张平文当选美国工业与应用数学学会会士
  2. 无数学不华为?人工智能时代的数学家还将走得更远
  3. C语言与C++不得不说的那点事
  4. 无线传感器网络协议与体系结构 思维导图 (book) Protocols and Architectures for Wireless Sensor Networks, Holger Karl
  5. 知识图谱推理问答:如何让机器像人类一样学会推理
  6. 报名 | 刘鹰教授:草根创新力:中国经济快速发展的秘诀
  7. 近期AI领域8篇精选论文(附论文、代码)
  8. 各类机器学习问题的最优结果合集!附论文及实现地址索引
  9. Nature新研究:酒精导致的DNA损伤能被安全修复,为降低酒精性癌症发病率开辟机会...
  10. html背景音乐demo,music.html