此文章首发于

卷积神经网络(CNN)入门讲解​zhuanlan.zhihu.com

内容如有修改,不在此处修改,请关注知乎:蒋竺波

----------------------------分割线------------------------------------------------------------

大家在看一些机器学习或者深度学习的文章时,在数据预处理的时候,会不会经常看到一个步骤:

(输入数据-数据均值)/数据标准差

初学者的你可能就直接略过了

因为你觉得它就是一个简单的线性变换,并没有多复杂

但是

就像爱因斯坦的相对论:

E = mc^2

大道至简

这个数据预处理的步骤在机器学习或者深度学习里面,都是重中之重

其实,它是标准化(Normalization)的一种


今天的内容:

当然,标准化的方法这是最常用的。

Z-score 怎么用python 代码实现:

实现时有2种不同的方式:
(1),使用sklearn.preprocessing.scale()函数,直接将数据进行标准化。
(2),使用sklearn.preprocessing.StandardScaler类,其优点可以保存训练数据中的参数(均值、方差),也可以直接使用其对象转换(transform)其测试集数据。

标准化的方法有很多,还有归一化,规范化等,具体都可以在 网上找到答案

其他参考资料:

【原】关于使用sklearn进行数据预处理 -- 归一化/标准化/正则化​www.cnblogs.com 数据标准化的方法与意义 - CSDN博客​blog.csdn.net

----------------------------分割线------------------------------------------------------------

下面我们来看看,在CNN中,我们为什么要给图像做标准化

很多时候我们的训练图片会出现下面的情况:

大家看上面两只猪,对于人来说,它就是两只一样的猪,只是图片的灰度或者曝光度不一样罢了,于是我们都给它们都标注为社会人

咋一看,好像没毛病

但是,虽然我们人眼看没毛病,可是机器看的方式和我们不一样,他们看的是对应图片的像素值

由于曝光的,灰度等各种原因,他们像素值其实不一样,那么经过卷积层后,他们的特征很可能不一样

于是神经网络就尴尬了,特征都不一样,为啥标签都一样呢?

这样,迷惑的神经网络就不知道怎么对权值进行训练了

另一种情况:

当然,我上面就是举了两个例子,还有很多情况需要进行标准化才能解决,标准化常用的是Z-Score, 记住,这是要减去自己数据的均值和除以自己的标准差(不是方差)

大家在用Fine-tune pretrained model,比如Imagenet, 程序里面经常是减去的Imagenet的均值和方差,这样是不对的,大家在跑程序的时候要注意了。

在公众号里回复:标准化,可以获得全部高清PPT哦!!

关于标准化在机器学习方面的应用,可以参考下面资料:

nnetInfo文章浏览​nnetinfo.com parkson:R--数据标准化、归一化、中心化处理​zhuanlan.zhihu.com

网上有很多,大家可以自己找找。

希望大家多多点赞,谢谢啦。

有问题,欢迎提问。

CNN 入门讲解:什么是标准化?相关推荐

  1. CNN入门讲解:卷积层是如何提取特征的?

    各位看官老爷们 好久不见 这里是波波给大家带来的CNN卷积神经网络入门讲解 每周我将给大家带来绝对原创,脑洞大开,幽默风趣的深度学习知识点入门讲解 希望大家多多支持,多多关注 本人微信公众号:foll ...

  2. CNN 入门讲解:什么是全连接层

    新年第一更 祝大家新年快乐万事如意 这个时候还愿意点进来,新的一年肯定要起飞了 这情人节和新年连着过啊 这对情侣意味着什么,意味着要带情人去见家长了 当然对一些情侣意味着,情人节过不好,估计年也过不好 ...

  3. 机器不学习:CNN 入门讲解1-什么是卷积

    机器不学习(jqbxx.com)-机器学习好网站 我们第一部分先讲 Convolution,到底什么是卷积,别忙,大家都用过某美颜软件吧, 比如我老婆新垣结衣: 美的不要的不要的..... 然后我锐化 ...

  4. CNN入门讲解:不一样的Softmax

    今天我们的主题是CNN最后最后那个Softmax Function 可是网上已经把关于Softmax讲烂了 于是今天,我只想谈谈我对Softmax某些方面的理解 建议大家看之前,先去别的地方学习一些S ...

  5. CNN入门+猫狗大战(Dogs vs. Cats)+PyTorch入门

    一些修改(修改后的代码) 修改原网络的输出方式.原网络采用的交叉熵torch.nn.CrossEntropyLoss()进行Loss计算,而这个函数内部是已经进行了softmax处理的(参考),所以网 ...

  6. 【直播】耿远昊:Pandas入门讲解(安泰第四届数据科学训练营)

    Pandas入门讲解 直播信息 主讲人:耿远昊,Datawhale成员,joyful-pandas作者. 直播时间:2021年04月07日 20:00~21:00 直播内容: 时间序列中的必知必会: ...

  7. 一看就明白的爬虫入门讲解:基础理论篇

    一看就明白的爬虫入门讲解:基础理论篇 发表于2015-11-13 18:50| 5909次阅读| 来源CSDN| 37 条评论| 作者孔淼 爬虫经验分享HTMLCSSAjaxApp网络 width=& ...

  8. 一看就明白的爬虫入门讲解-基础理论篇(下篇)

    文/孔淼 上篇我分享了爬虫入门中的"我们的目的是什么"."内容从何而来"."了解网络请求"这三部分的内容,这一篇我继续分享以下内容: 1) 一些常见的限制方式 2) 尝试解决问题的思路 3) 效率问题 ...

  9. 一看就明白的爬虫入门讲解-基础理论篇(上篇)

    作者:孔淼 关于爬虫内容的分享,我会分成两篇,六个部分来分享,分别是: 1)  我们的目的是什么 2)  内容从何而来 3)  了解网络请求 4)  一些常见的限制方式 5)  尝试解决问题的思路 6 ...

最新文章

  1. cocos v3.10 下载地址
  2. 总结C#中窗体间传递数据的几种方法
  3. 华硕P8B-C/2L及其他
  4. python中xlwt的局限,Python xlwt 生成Excel和设置特定单元格不可编辑
  5. linux内核功能关闭透明大页 功能,redhat linux 7.4关闭透明大页
  6. (8)css常用样式属性3
  7. mkdir命令的-p和-m
  8. SQL Server(express)安装教程
  9. linux 查看文件夹大小
  10. 夜神模拟器怎么打开开发者选项
  11. cntv客户端_cntv网络电视_cntv官方下载-太平洋下载中心
  12. python_计算股票指标
  13. NXCOMPAT选项和数据执行保护DEP
  14. MATLAB强化学习入门——五、倒立摆的DQN神经网络控制
  15. 智能红外遥控器(三):红外学习温湿度读取
  16. 微信小程序 收起键盘 wx.hideKeyboard()
  17. 2020 Q2 DeFi报告:流动性挖矿狂热未带来新用户,DeFi任重道远
  18. 冯诺依曼计算机体系结构
  19. 国家信息安全水平考试NISP一级模拟题(02)
  20. 大学计算机实验六文件管理与磁盘恢复,虚拟实验:文件管理与磁盘恢复.pdf

热门文章

  1. 美团给应届生开年薪35万+ 倒挂老员工:加油、打工人
  2. iOS 【使用自定义字体-苹方字体】
  3. 判断一个点是否在闭合曲线内
  4. t.cn新浪短链接 生成
  5. Checking Table 设计模式 - 从概念、建模、设计到实现——兼谈基于业务需求驱动的设计模式创新
  6. 描述12个异性追求者(互动媒体技术作业)
  7. 安装snipe-IT遇到的php问题
  8. 《朱子治家格言》原文
  9. 提升执行力,小米手环打造TODO神器
  10. 最新阿里巴巴面试题合集附带答案,答对70%你也可以进阿里(天猫+蚂蚁金服+阿里巴巴)