CNN 入门讲解:什么是标准化?
此文章首发于
卷积神经网络(CNN)入门讲解zhuanlan.zhihu.com
内容如有修改,不在此处修改,请关注知乎:蒋竺波
----------------------------分割线------------------------------------------------------------
大家在看一些机器学习或者深度学习的文章时,在数据预处理的时候,会不会经常看到一个步骤:
(输入数据-数据均值)/数据标准差
初学者的你可能就直接略过了
因为你觉得它就是一个简单的线性变换,并没有多复杂
但是
就像爱因斯坦的相对论:
E = mc^2
大道至简
这个数据预处理的步骤在机器学习或者深度学习里面,都是重中之重
其实,它是标准化(Normalization)的一种
今天的内容:
当然,标准化的方法这是最常用的。
Z-score 怎么用python 代码实现:
实现时有2种不同的方式:
(1),使用sklearn.preprocessing.scale()函数,直接将数据进行标准化。
(2),使用sklearn.preprocessing.StandardScaler类,其优点可以保存训练数据中的参数(均值、方差),也可以直接使用其对象转换(transform)其测试集数据。
标准化的方法有很多,还有归一化,规范化等,具体都可以在 网上找到答案
其他参考资料:
【原】关于使用sklearn进行数据预处理 -- 归一化/标准化/正则化www.cnblogs.com 数据标准化的方法与意义 - CSDN博客blog.csdn.net
----------------------------分割线------------------------------------------------------------
下面我们来看看,在CNN中,我们为什么要给图像做标准化
很多时候我们的训练图片会出现下面的情况:
大家看上面两只猪,对于人来说,它就是两只一样的猪,只是图片的灰度或者曝光度不一样罢了,于是我们都给它们都标注为社会人
咋一看,好像没毛病
但是,虽然我们人眼看没毛病,可是机器看的方式和我们不一样,他们看的是对应图片的像素值
由于曝光的,灰度等各种原因,他们像素值其实不一样,那么经过卷积层后,他们的特征很可能不一样
于是神经网络就尴尬了,特征都不一样,为啥标签都一样呢?
这样,迷惑的神经网络就不知道怎么对权值进行训练了
另一种情况:
当然,我上面就是举了两个例子,还有很多情况需要进行标准化才能解决,标准化常用的是Z-Score, 记住,这是要减去自己数据的均值和除以自己的标准差(不是方差)
大家在用Fine-tune pretrained model,比如Imagenet, 程序里面经常是减去的Imagenet的均值和方差,这样是不对的,大家在跑程序的时候要注意了。
在公众号里回复:标准化,可以获得全部高清PPT哦!!
关于标准化在机器学习方面的应用,可以参考下面资料:
nnetInfo文章浏览nnetinfo.com parkson:R--数据标准化、归一化、中心化处理zhuanlan.zhihu.com
网上有很多,大家可以自己找找。
希望大家多多点赞,谢谢啦。
有问题,欢迎提问。
CNN 入门讲解:什么是标准化?相关推荐
- CNN入门讲解:卷积层是如何提取特征的?
各位看官老爷们 好久不见 这里是波波给大家带来的CNN卷积神经网络入门讲解 每周我将给大家带来绝对原创,脑洞大开,幽默风趣的深度学习知识点入门讲解 希望大家多多支持,多多关注 本人微信公众号:foll ...
- CNN 入门讲解:什么是全连接层
新年第一更 祝大家新年快乐万事如意 这个时候还愿意点进来,新的一年肯定要起飞了 这情人节和新年连着过啊 这对情侣意味着什么,意味着要带情人去见家长了 当然对一些情侣意味着,情人节过不好,估计年也过不好 ...
- 机器不学习:CNN 入门讲解1-什么是卷积
机器不学习(jqbxx.com)-机器学习好网站 我们第一部分先讲 Convolution,到底什么是卷积,别忙,大家都用过某美颜软件吧, 比如我老婆新垣结衣: 美的不要的不要的..... 然后我锐化 ...
- CNN入门讲解:不一样的Softmax
今天我们的主题是CNN最后最后那个Softmax Function 可是网上已经把关于Softmax讲烂了 于是今天,我只想谈谈我对Softmax某些方面的理解 建议大家看之前,先去别的地方学习一些S ...
- CNN入门+猫狗大战(Dogs vs. Cats)+PyTorch入门
一些修改(修改后的代码) 修改原网络的输出方式.原网络采用的交叉熵torch.nn.CrossEntropyLoss()进行Loss计算,而这个函数内部是已经进行了softmax处理的(参考),所以网 ...
- 【直播】耿远昊:Pandas入门讲解(安泰第四届数据科学训练营)
Pandas入门讲解 直播信息 主讲人:耿远昊,Datawhale成员,joyful-pandas作者. 直播时间:2021年04月07日 20:00~21:00 直播内容: 时间序列中的必知必会: ...
- 一看就明白的爬虫入门讲解:基础理论篇
一看就明白的爬虫入门讲解:基础理论篇 发表于2015-11-13 18:50| 5909次阅读| 来源CSDN| 37 条评论| 作者孔淼 爬虫经验分享HTMLCSSAjaxApp网络 width=& ...
- 一看就明白的爬虫入门讲解-基础理论篇(下篇)
文/孔淼 上篇我分享了爬虫入门中的"我们的目的是什么"."内容从何而来"."了解网络请求"这三部分的内容,这一篇我继续分享以下内容: 1) 一些常见的限制方式 2) 尝试解决问题的思路 3) 效率问题 ...
- 一看就明白的爬虫入门讲解-基础理论篇(上篇)
作者:孔淼 关于爬虫内容的分享,我会分成两篇,六个部分来分享,分别是: 1) 我们的目的是什么 2) 内容从何而来 3) 了解网络请求 4) 一些常见的限制方式 5) 尝试解决问题的思路 6 ...
最新文章
- cocos v3.10 下载地址
- 总结C#中窗体间传递数据的几种方法
- 华硕P8B-C/2L及其他
- python中xlwt的局限,Python xlwt 生成Excel和设置特定单元格不可编辑
- linux内核功能关闭透明大页 功能,redhat linux 7.4关闭透明大页
- (8)css常用样式属性3
- mkdir命令的-p和-m
- SQL Server(express)安装教程
- linux 查看文件夹大小
- 夜神模拟器怎么打开开发者选项
- cntv客户端_cntv网络电视_cntv官方下载-太平洋下载中心
- python_计算股票指标
- NXCOMPAT选项和数据执行保护DEP
- MATLAB强化学习入门——五、倒立摆的DQN神经网络控制
- 智能红外遥控器(三):红外学习温湿度读取
- 微信小程序 收起键盘 wx.hideKeyboard()
- 2020 Q2 DeFi报告:流动性挖矿狂热未带来新用户,DeFi任重道远
- 冯诺依曼计算机体系结构
- 国家信息安全水平考试NISP一级模拟题(02)
- 大学计算机实验六文件管理与磁盘恢复,虚拟实验:文件管理与磁盘恢复.pdf