引言

在运用一些机器学习算法的时候不可避免地要对数据进行特征缩放(feature scaling),比如:在随机梯度下降(stochastic gradient descent)算法中,特征缩放有时能提高算法的收敛速度。下面我会主要介绍一些特征缩放的方法。

什么是特征缩放

特征缩放是用来标准化数据特征的范围。

机器算法为什么要特征缩放

特征缩放还可以使机器学习算法工作的更好。比如在K近邻算法中,分类器主要是计算两点之间的欧几里得距离,如果一个特征比其它的特征有更大的范围值,那么距离将会被这个特征值所主导。因此每个特征应该被归一化,比如将取值范围处理为0到1之间。

就如我在引言所说,特征缩放也可以加快梯度收敛的速度。

特征缩放的一些方法

调节比例(Rescaling)

这种方法是将数据的特征缩放到[0,1]或[-1,1]之间。缩放到什么范围取决于数据的性质。对于这种方法的公式如下:

x′=x−min(x)max(x)−min(x)

x' = \frac{x - min(x)}{max(x) - min(x)}

x x是最初的特征值, x′x'是缩放后的值。

标准化(Standardization)

特征标准化使每个特征的值有零均值(zero-mean)和单位方差(unit-variance)。这个方法在机器学习地算法中被广泛地使用。例如:SVM,逻辑回归和神经网络。这个方法的公式如下:

x′=x−x¯σ

x' = \frac{x - \bar x}{\sigma}

浅谈机器学习中的特征缩放(feature scaling)相关推荐

  1. 特征缩放 feature scaling

    样本不同特征的取值范围如果不一样,可能导致迭代很慢,为了减少特征取值的影响,可以对特征数据进行缩放,加速算法的收敛.常见的映射范围有 [0,1][0, 1][0,1] 和 [−1,1][-1, 1][ ...

  2. 机器学习中的特征缩放(feature scaling)浅谈

    引言 在运用一些机器学习算法的时候不可避免地要对数据进行特征缩放(feature scaling),比如:在随机梯度下降(stochastic gradient descent)算法中,特征缩放有时能 ...

  3. 特征缩放feature scaling(吴恩达版详解)

    前言 最近在学习吴恩达的深度学习,对于特征缩放的知识点很是困惑,不明白为什么它会加快收敛速度,在网上看大佬们的解答,大佬们也都是给了两个对比图之后就把这个问题带过去了,于是我认认真真,反复看了吴恩达的 ...

  4. 机器学习中的特征重要性 Feature Importance

    Feature Importance 闲话 几周没用CSDN,发现编辑器的字体变了.最近看了几篇讲特征重要性的文章.在这里[简要]记录一下我的总结,对不熟悉相关知识的读者做个导航. 优点 知道数据中的 ...

  5. 欧几里得范数_浅谈机器学习中的范数

    机器学习中范数的广义定义: 一个范数是一个真实的向量空间V中的关于|| . ||的一个函数映射关系,其满足以下3个条件 (1)||x|| ≥ 0,当且仅当 x=0的时候等号成立 (2)||αx|| = ...

  6. 浅谈机器学习中的过拟合

    本篇博客主要是基于花书(古德费洛的<Deep Learning>)和西瓜书(周志华的<机器学习>)撰写的,其中插入了博主的一些个人见解,如有不对之处希望大家指出来一起来讨论一下 ...

  7. 浅谈机器学习中的QR分解

    1. QR 分解的形式 QR 分解是把矩阵分解成一个正交矩阵与一个上三角矩阵的积.QR 分解经常用来解线性最小二乘法问题.QR 分解也是特定特征值算法即QR算法的基础.用图可以将分解形象地表示成: 其 ...

  8. 机器学习中的特征是什么?机器学习知识点详解

    在机器学习中,特征(feature)指的是描述一个实例的属性或特征,也可以称为自变量(independent variable)或输入变量(input variable).特征是机器学习中非常重要的概 ...

  9. 浅谈机器学习之深度学习

    浅谈机器学习之深度学习 从人工智能到机器学习再到深度学习 人工智能是个很大的知识集合体,但目前有个和它关系最大的学科---机器学习 机器学习是一门多领域交叉学科,涉及概率论.统计学.逼近论.凸分析.算 ...

最新文章

  1. 直播APP开发:直播的广告效益和号召力分析
  2. OpenGL GLSL Shader Subroutines函数的实例
  3. 实现Profile购物车的匿名用户迁移
  4. [Redis6]新数据类型_HyperLogLog
  5. jquery autocomplete的使用
  6. abcdefg顺序Java打印,全国2012年10月自考JAVA语言程序设计(一)试题及答案
  7. java private list_Java基础知识回顾之四 ----- 集合List、Map和Set
  8. bzoj 4975: 区间翻转(博弈)
  9. 动态调用Webservice 支持Soapheader身份验证(转)
  10. Python实现按照指定要求逆序输出一个数字的方法
  11. R中数据结构与数据的输入
  12. 跨域小结(为什么form表单提交没有跨域问题,但ajax提交有跨域问题)
  13. Spring boot与Spring cloud
  14. 今日发现:BlueJ和MenuetOS
  15. 树莓派 电脑 网线对联 桥接及ssh
  16. ubuntu自动同步时间
  17. 【图像处理】图像分割之(一~四)GraphCut,GrabCut函数使用和源码解读(OpenCV)
  18. 宝塔怎么看蜘蛛爬取日志
  19. 【ChatGPT4】王老师零基础《NLP》(自然语言处理)第一课
  20. Qt 多显示器扩展模式

热门文章

  1. 安徽省淮北市谷歌卫星地图下载
  2. 记录getElementsByTagName()
  3. 10家不同商店50种不同商品销售量预测数据
  4. 3.Linux网络DNS域名解析服务
  5. 未找到类型“****”上的构造函数的解决方案
  6. win7网络中计算机少,Win7网络不稳定如何解决?
  7. a标签去下划线或文字添加下修饰_怎么去掉html a超链接下划线
  8. Mac如何修改文件的默认打开程序
  9. 【STemWin】STM32F429IG单片机用LTDC驱动正点原子7寸RGB彩色触摸屏,并裸机移植STemWin图形库
  10. 为什么现在的会员制仓储店都集体爆发了?