• z-score标准化:这是最常见的特征预处理方式,基本所有的线性模型在拟合的时候都会做 z-score标准化。具体的方法是求出样本特征x的均值mean和标准差std,然后用(x-mean)/std来代替原特征。这样特征就变成了均值为0,方差为1了。
  • max-min标准化:也称为离差标准化,预处理后使特征值映射到[0,1]之间。具体的方法是求出样本特征x的最大值max和最小值min,然后用(x-min)/(max-min)来代替原特征。如果我们希望将数据映射到任意一个区间[a,b],而不是[0,1],那么也很简单。用(x-min)(b-a)/(max-min)+a来代替原特征即可。
  • L1/L2范数标准化:如果我们只是为了统一量纲,那么通过L2范数整体标准化也是可以的,具体方法是求出每个样本特征向量 x的L2范数||x||2,然后用x/||x||2代替原样本特征即可。当然L1范数标准化也是可以的,即用x /||x||1代替原样本特征。通常,范数标准化首选L2范数标准化。
  • 此外,经常我们还会用到中心化,主要是在PCA降维的时候,此时我们求出特征x的平均值mean后,用x-mean代替原特征,也就是特征的均值变成了0, 但是方差并不改变。这个很好理解,因为PCA就是依赖方差来降维的,如果我们做了z-score标准化,所以特征的方差为1,那么就没法来降维了。
  • 虽然大部分机器学习模型都需要做标准化和归一化,也有不少模型可以不做做标准化和归一化,主要是基于概率分布的模型,比如决策树大家族的CART,随机森林等。当然此时使用标准化也是可以的,大多数情况下对模型的泛化能力也有改进。

特征的标准化和归一化相关推荐

  1. Python数据攻略-数据特征处理标准化和归一化

    大家好,我是Mr.数据杨.标准化和归一化,其实就如同三国中的武将们练习武艺,各自拥有自己的武技标准.比如说关羽的青龙偃月刀的使用技巧,张飞的矛法等,它们都是在各自的范围内标准化了,然后他们在战场上的表 ...

  2. 机器学习特征工程--标准化和归一化

    关于归一化和标准化 1.标准化使用条件 (1)不需要对特征进行归一化:基于树模型的方法 举例:  随机森林/bagging/boosting/xgboost 需要标准化的(基于距离的模型):回归分析( ...

  3. 标准化和归一化,请勿混为一谈,透彻理解数据变换

    标准化与归一化 1.标准化(Standardization)和归一化(Normalization)概念 1.1.定义 1.2.联系和差异 一.联系 二.差异 1.3.标准化和归一化的多种方式 2.标准 ...

  4. ML之FE:数据处理—特征工程之特征三化(标准化【四大数据类型(数值型/类别型/字符串型/时间型)】、归一化、向量化)简介、代码实现、案例应用之详细攻略

    ML之FE:数据处理-特征工程之特征三化(标准化[四大数据类型(数值型/类别型/字符串型/时间型)].归一化.向量化)简介.代码实现.案例应用之详细攻略 目录 真正意义的标准化与归一化 1.标准化/Z ...

  5. [机器学习] 数据特征 标准化和归一化

    一.标准化/归一化定义 归一化和标准化经常被搞混,程度还比较严重,非常干扰大家的理解.为了方便后续的讨论,必须先明确二者的定义. 归一化 就是将训练集中某一列数值特征(假设是第i列)的值缩放到0和1之 ...

  6. 一篇文章告诉你标准化和归一化的区别?

    一篇文章告诉你标准化和归一化的区别? 2019-02-28 17:12:39 融融网融融网阅读量:484 进一步推进企业的标准化工作,使之发展水平适应经济全球化下市场竞争的要求,促进企业综合实力的提升 ...

  7. 影像组学视频学习笔记(19)-数据标准化、归一化极简概述、Li‘s have a solution and plan.

    本笔记来源于B站Up主: 有Li 的影像组学系列教学视频 本节(19)主要介绍: 数据的标准化.归一化 为什么要进行标准化.归一化? 机器学习算法的要求 便于横向比较 # 标准化 (影像组学中最常用) ...

  8. 独家 | 数据转换:标准化vs 归一化(附代码链接)

    作者:Clare Liu, 英国金融科技数据科学家 翻译:林鹤冲 校对:王紫岳 本文约2300字,建议阅读10分钟 本文将解释数据转换中常见的特征缩放方法:"标准化"和" ...

  9. 【机器学习基础】Python数据预处理:彻底理解标准化和归一化

    数据预处理 数据中不同特征的量纲可能不一致,数值间的差别可能很大,不进行处理可能会影响到数据分析的结果,因此,需要对数据按照一定比例进行缩放,使之落在一个特定的区域,便于进行综合分析. 常用的方法有两 ...

  10. [转] 标准化和归一化

    from : http://www.raincent.com/content-10-12066-1.html 一.标准化/归一化定义 归一化和标准化经常被搞混,程度还比较严重,非常干扰大家的理解.为了 ...

最新文章

  1. consolez设置
  2. 干货! AI 推断解决方案栈 Vitis AI 全流程独家解析
  3. P1338 末日的传说
  4. 7个示例科普CPU Cache
  5. 如何使用ActionScript来检测用户的操作系统种类及浏览器类型
  6. 从今天开始学习iOS开发(iOS 7版)-- 概论 (一)
  7. bzoj 2761: [JLOI2011]不重复数字【hash】
  8. [导入]DotText源码阅读(2)-工程、数据库表结构
  9. 前嗅ForeSpider教程:采集图片/视频/资源文件的链接地址 1
  10. javascript 一次开发,多平台运行
  11. 如何把代码写的更优雅,你需要这一份代码精进书单!
  12. 微商推广引流秘笈—— 8 个高效的引流策略
  13. [Paddle2.0学习之第一步]实现波士顿房价预测
  14. 思维模型 MECE原则
  15. 云痕大数据 家长登录_云痕大数据平台的使用对初中英语教与学的作用
  16. 企业微信视频教程(Java标准版)-翟东平-专题视频课程
  17. SSM毕设项目校园书蜀黍易购平台xk9g6(java+VUE+Mybatis+Maven+Mysql)
  18. DroidPlugin插件框架 - 《Android必备技能》
  19. 【源码】YOLOv5云端API部署
  20. Win10与Ubuntu 20.04 LTS并存安装

热门文章

  1. JQuery的父、子、兄弟节点查找,节点的子节点循环
  2. ubuntu16.04下怎么安装flash player
  3. TableViewCell的折展(Masonry)
  4. 牛客--二维数组中的查找
  5. 云集新功能:移动 Web 调试从未变得如此简单
  6. WebServer Vs ApplicationServer
  7. Solaris 简单命令
  8. 《隋唐演义》二:竞争对手的实力在不断增强
  9. php网页制作头部和尾部,用phpcms如何将静态页面制作成企业网站,头部加尾部
  10. 手机代理上网_ip地址是怎么来的?手机电脑怎么获得IP地址?