机器学习笔记:为什么要对数据进行归一化处理?

rocling

于 2019-06-22 17:03:39 发布

7090
 收藏 9
分类专栏: 人工智能 文章标签: 机器学习 归一化
版权

人工智能
专栏收录该内容
130 篇文章8 订阅
订阅专栏
转自:https://zhuanlan.zhihu.com/p/27627299

在喂给机器学习模型的数据中,对数据要进行归一化的处理。

为什么要进行归一化处理,下面从寻找最优解这个角度给出自己的看法。

例子
假定为预测房价的例子,自变量为面积,房间数两个,因变量为房价。

那么可以得到的公式为:

其中代表房间数,代表变量前面的系数。

其中代表面积,代表变量前面的系数。

首先我们祭出两张图代表数据是否均一化的最优解寻解过程。

未归一化:

归一化之后

为什么会出现上述两个图,并且它们分别代表什么意思。

我们在寻找最优解的过程也就是在使得损失函数值最小的theta1,theta2。

上述两幅图代码的是损失函数的等高线。

我们很容易看出,当数据没有归一化的时候,面积数的范围可以从0~1000,房间数的范围一般为0~10,可以看出面积数的取值范围远大于房间数。

影响
这样造成的影响就是在画损失函数的时候,

数据没有归一化的表达式,可以为:

造成图像的等高线为类似椭圆形状,最优解的寻优过程就是像下图所示:

而数据归一化之后,损失函数的表达式可以表示为:

其中变量的前面系数几乎一样,则图像的等高线为类似圆形形状,最优解的寻优过程像下图所示:

从上可以看出,数据归一化后,最优解的寻优过程明显会变得平缓,更容易正确的收敛到最优解。

这也是数据为什么要归一化的一个原因。
————————————————
版权声明:本文为CSDN博主「rocling」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/rocling/article/details/93339564

机器学习笔记:为什么要对数据进行归一化处理?相关推荐

  1. 机器学习---之为什么要对数据进行归一化

    一就是特征组合问题,比如房子的长和宽作为两个特征参与模型的构造,不如把其相乘得到面积然后作为一个特征来进行求解,这样在特征选择上就做了减少维度的工作. 二就是特征归一化(Feature Scaling ...

  2. 为什么一些机器学习模型需要对数据进行归一化?——1)归一化后加快了梯度下降求最优解的速度;2)归一化有可能提高精度...

    为什么一些机器学习模型需要对数据进行归一化? http://www.cnblogs.com/LBSer/p/4440590.html 机器学习模型被互联网行业广泛应用,如排序(参见:排序学习实践).推 ...

  3. 为什么一些机器学习模型需要对数据进行归一化?

    http://www.cnblogs.com/LBSer/p/4440590.html 机器学习模型被互联网行业广泛应用,如排序(参见:排序学习实践).推荐.反作弊.定位(参见:基于朴素贝叶斯的定位算 ...

  4. 机器学习之数据预处理——归一化,标准化

    机器学习之数据预处理--归一化,标准化 基础知识 1.什么是特征预处理 2.预处理方法 : 3.预处理API: 数据的标准化(normalization)和归一化 数据的标准化 数据归一化 1 把数变 ...

  5. 机器学习笔记1:基于Logistic回归进行数据预测

    机器学习笔记1:基于Logistic回归进行数据预测 一.背景 近期项目的一个核心部分就是实现对数据的预测,因为没有实际的数据样本,所以我准备近期学习Machine Learning的几种方式,从简单 ...

  6. 机器学习中数据的归一化处理

    数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间.在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能 ...

  7. 机器学习笔记(5) KNN算法

    这篇其实应该作为机器学习的第一篇笔记的,但是在刚开始学习的时候,我还没有用博客记录笔记的打算.所以也就想到哪写到哪了. 你在网上搜索机器学习系列文章的话,大部分都是以KNN(k nearest nei ...

  8. Python机器学习笔记:sklearn库的学习

    自2007年发布以来,scikit-learn已经成为Python重要的机器学习库了,scikit-learn简称sklearn,支持包括分类,回归,降维和聚类四大机器学习算法.还包括了特征提取,数据 ...

  9. 【学习打卡05】可解释机器学习笔记之CAM+Captum代码实战

    可解释机器学习笔记之CAM+Captum代码实战 文章目录 可解释机器学习笔记之CAM+Captum代码实战 代码实战介绍 torch-cam工具包 可视化CAM类激活热力图 预训练ImageNet- ...

最新文章

  1. 中国大学科技园市场投资规划及需求前景预测报告2022-2028年版
  2. React事件系统研究总结
  3. linux 重读环境变量,关于linux中使用source /etc/profile重新读取配置后,新的环境变量只能在当前终端里面有效,新开的终端提示 command not found...
  4. 爬虫基本功之学点JS(一)
  5. iPhone 12延期恐实锤:台积电5nm A14芯片将延期3个月
  6. [转]PHP或ASP   中Cookie禁用了,Session还能用吗?
  7. spring3,上传文件ApplicationHttpRequest cannot be ca...
  8. 2022珠三角深圳锂电池技术展览会暨论坛|2022华南广东深圳锂电池技术展览会
  9. 爬取豆瓣电影分类排行榜
  10. 工厂模式及在项目中的应用
  11. python interpreter是什么_如何写一个Python Interpreter | 学步园
  12. IBM建立大中华区云计算中心供验证测试
  13. 坑了程序员的政府项目是什么样的?
  14. html页面宽度和高度,页面布局宽度和高度 网页设计合适的页面尺寸是多少
  15. 创建电脑对象,电脑对象有关机和开机方法(静态对象构造方法)
  16. java即时通讯im聊天源码,dubbo即时通讯im聊天源码,netty即时通讯im聊天源码,springboot即时通讯im聊天源码
  17. VTD解析XML( VTDGen、AutoPilot )
  18. minst手写数字识别(带界面)
  19. 23 《武士道》 -豆瓣评分7.8
  20. 全方位解析 pinia

热门文章

  1. 盐城工学院计算机考研高吗,信息学院计算机班计玮考取中南大学研究生
  2. NIO详解(四):NIO编程
  3. python回顾(四)——面向对象
  4. 电脑新安装JDK版本并运行使用该JDK版本问题
  5. 19、HTML5 新的 Input 类型
  6. 字符串的模式匹配(Java实现)
  7. UML Design Via Visual Studio-Sequence Diagram
  8. C++Primer 第一章 快速入门 学习
  9. javascript获取textarea中光标的位置 兼容
  10. msm8974 camera driver添加新摄像头kernel hal修改