Scikit-learn 数据预处理之归一化MinMaxScaler

1 声明

本文的数据来自网络,部分代码也有所参照,这里做了注释和延伸,旨在技术交流,如有冒犯之处请联系博主及时处理。

2 MinMaxScaler简介

MinMaxScaler当数据(x)按照最小值中心化后,再按极差(最大值 - 最小值)缩放,数据移动了最小值个单位,并且会被收敛到[0,1]之间,该过程叫数据归一化(Normalization,又称Min-Max Scaling)

应用场景:在不涉及距离度量、协方差、数据不符合正态分布、异常值较少时。

3 MinMaxScaler

计算公式(A为某个属性或者特征):

import pandas as pd
from sklearn.preprocessing import MinMaxScaler
data = pd.DataFrame({'a':[1,2,3],'b':[5,6,6],'c':[9,100,2]}
)
print(data.values)
#归一化(MinMaxScaler)
min_max_scaler = MinMaxScaler(feature_range=[0,1])
min_max_scaler_data=min_max_scaler.fit_transform(data)
print(min_max_scaler_data)

注: 1 默认缩放到0到1之间。可通过feature_range指定区间。

2 这里的数据矩阵形式如下:

Scikit-learn 数据预处理之归一化MinMaxScaler相关推荐

  1. pandas用众数填充缺失值_【机器学习】scikit-learn中的数据预处理小结(归一化、缺失值填充、离散特征编码、连续值分箱)...

    一.概述 1. 数据预处理 数据预处理是从数据中检测,修改或删除不准确或不适用于模型的记录的过程 可能面对的问题有:数据类型不同,比如有的是文字,有的是数字,有的含时间序列,有的连续,有的间断. 也可 ...

  2. 数据预处理之归一化/标准化/正则化/零均值化

    数据预处理之归一化/标准化/正则化/零均值化 一.标准化(Standardization) 二.归一化(Normalization) 三,中心化/零均值化 (Zero-centered) 四.正则化 ...

  3. 数据归一化处理方法_数据预处理:归一化和标准化

    1. 概述 数据的归一化和标准化是特征缩放(feature scaling)的方法,是数据预处理的关键步骤.不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间 ...

  4. 【python学习】数据预处理-如何归一化?

    作者:代码律动 链接:数据预处理的归一化手段应该如何应用到训练集,测试集和验证集中? - 知乎 来源:知乎 著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注明出处. 作者:Orginal ...

  5. 神经网络中的网络优化和正则化(二)之参数初始化/数据预处理/逐层归一化

    转载请注明出处:https://thinkgamer.blog.csdn.net/article/details/101026786 博主微博:http://weibo.com/234654758 G ...

  6. pandas数据预处理(标准化归一化、离散化/分箱/分桶、分类数据处理、时间类型数据处理、样本类别分布不均衡数据处理、数据抽样)

    1. 数值型数据的处理 1.1 标准化&归一化 数据标准化是一个常用的数据预处理操作,目的是处理不同规模和量纲的数据,使其缩放到相同的数据区间和范围,以减少规模.特征.分布差异等对模型的影响. ...

  7. 机器学习中数据预处理——标准化/归一化方法(scaler)

    由于工作问题比较忙,有两周没有总结一下工作学习中遇到的问题. 这篇主要是关于机器学习中的数据预处理的scaler变化. 工作中遇到的问题是:流量预测问题,拿到的数据差距非常大,凌晨的通话流量很少几乎为 ...

  8. dataframe数据标准化处理_数据预处理——标准化/归一化(实例)

    这次我们来说说关于数据预处理中的数据标准化及归一化的问题.主要以理论+实例的方式为大家展示. 本次实验也将会展示部分数据以及代码,有兴趣的小伙伴可以自己动手试试~ 在本次实例过程中,我们使用的数据是: ...

  9. 数据预处理--特征归一化

    为什么需要对数值类型的特征归一化? 对数据进行特征归一化(Normalization)处理,可以使得数据的各个特征处于同一数值量级,而不会导致模型学习出来的结果倾向于数值差别比较大的那些特征. 常用的 ...

最新文章

  1. jquery sortable简述
  2. Scanner对象及其获取数据出现小问题和解决方案
  3. linux下常用命令之nc
  4. 用nice等命令设定的进程优先级有什么确切的含义?
  5. 科大星云诗社动态20201123
  6. 洛谷 P1983 车站分级
  7. IPv6实验1_IPv6地址配置
  8. nodejs-- vuex中mapActions
  9. 链表应用 多项式相加
  10. 《统计学习方法》—— 朴素贝叶斯方法、详细推导及其python3实现(二)
  11. 蚂蚁金服研究员何征宇:系统软件和开源都是手段,不是目的
  12. idea中pom中有些配置为什么不提示_Delegate IDE build/run actions to maven 配置的影响
  13. 计算机代码大全喜欢你,微信示爱代码大全 七夕情人节微信翻译表白代码2021
  14. 仿链家地图找房_iOS地图找房(类似链家、安居客等地图找房)
  15. 手机也可以接USB摄像头了
  16. 什么是虚短、虚断、虚地
  17. 傅里叶分解、叠加《matplotlib学习》
  18. 数字化转型不是选择,是生存发展的必然。
  19. 函数的连续性与间断点
  20. 在excel中批量插入分页符

热门文章

  1. opengl加载显示3D模型X3D类型文件
  2. wxWidgets:wxScopedPtr类用法
  3. boost::detail::lightweight_mutex相关的测试程序
  4. boost::python::bases相关的测试程序
  5. boost::mpl模块实现logical相关的测试程序
  6. boost::r_c_shortest_paths用法的测试程序
  7. boost::geometry::index::detail::segment_intersection用法的测试程序
  8. boost::geometry::select_most_precise用法的测试程序
  9. boost::allocator_max_size的实例
  10. ITK:在签名图像中找到零交叉点