文章目录

  • 一、CNN的基本概念
  • 二、常见的卷积
    • 1.一般卷积
    • 2.扩张卷积(空洞卷积)
    • 3.转置卷积(反卷积)
    • 4.可分离卷积
      • 4.1.空间可分离卷积
      • 4.2.深度可分离卷积
  • 三、CNN的输入输出尺寸计算公式
    • 3.1.卷积层
    • 3.2.池化层
  • 四、CNN常用的激活函数
    • 4.1.Sigmoid
    • 4.2.tanh
    • 4.3.Relu
  • 五、标准化和归一化
    • 1.标准化
      • 1.1.批标准化(Batch Normalization)
    • 2.归一化
  • 六、保存和加载模型
    • 1.仅保存学习到的参数
      • 1.1.保存模型:torch.save(model.state_dict(), PATH)
      • 1.2.调用模型:model.load_state_dict(torch.load(PATH));model.eval()
    • 2.保存整个model
      • 2.1.保存模型:torch.save(model,PATH)
      • 2.2.调用模型:model = torch.load(PATH)
  • 七、model.eval()和with torch.no_grad()的作用和区别
  • 八、Copy
  • 九、微调
    • 1.冻结
    • 2.修改层
  • 十、评价指标

一、CNN的基本概念

卷积填充池化参考此处
激活函数参考此处
简言之:
卷积有助于我们找到特定的局部图像特征。
池化是用于特征融合和降维,还可以防止过拟合。
激活函数是增加非线性,主要是为了解决梯度消失和梯度爆炸问题。

二、常见的卷积

参考此处

1.一般卷积

这个就是最常见的卷积了,看动图比较容易理解。

2.扩张卷积(空洞卷积)

这个主要用来扩大感受野,改变扩张率可获得多尺度信息。

3.转置卷积(反卷积)

就是卷积的逆过程做还原(恢复尺寸不恢复值),比如要可视化、分割还原、gan生成等。

4.可分离卷积

可分离卷积主要可分为空间可分离卷积和深度可分离卷积。

4.1.空间可分离卷积

用2个1D卷积核代替1个2D卷积核得到同样的结果,这样减少了计算量。

4.2.深度可分离卷积

对N通道分别进行卷积后,再对这个输出做一个pointwise核(11N)卷积,这样也减少了计算量。

11的卷积核可以降维、增加模型深度以及增加非线性。
N
N的卷积核可以

三、CNN的输入输出尺寸计算公式

3.1.卷积层

N=(W-F+2P)/S + 1
其中
N:输出大小
W:输入大小
F:卷积核大小
P:填充值的大小
S:步长大小

如当W=256,F=3,P=1,S=2时,N=(256-3+2*1)/2+1=128

3.2.池化层

N=(W+2P-D(F-1)-1)/S + 1
其中
N:输出大小
W:输入大小
D:空洞
F:池化核大小
P:填充值的大小
S:步长大小
*
如当W=128,D=0, F=2,P=0,S=2时,N=(128+0-0-1)/2+1=64
当分子为奇数时,无论分母是1还是2,分子在最后算的时候都会取为偶数

四、CNN常用的激活函数

4.1.Sigmoid

计算公式:

函数图像:

导数图像:

4.2.tanh

计算公式:
函数图像:

导数图像:

4.3.Relu

计算公式:

函数图像:

导数图像:

此外,还有LeakRelu、ERelu、Silu等。

五、标准化和归一化

参考此处

1.标准化

将数据变换为均值为0,标准差为1的分布

1.1.批标准化(Batch Normalization)

每个激活函数都有自己的非饱和区,在激活函数前如果没有BN的话,在非饱和区外的数据都会导致梯度消失,只有非饱和区的数据可用,也加快收敛,防止了过拟合,所以一般会在激活函数前加入BN。

2.归一化

将数据变换到某个区间范围,如[0,1]

总结:归一化是根据极小极大值缩放范围的,从这个定义出发,看自己的数据是否需要这样处理
标准化相比更常见,如在梯度计算时能加快收敛速度,处理不同尺度的特征等

六、保存和加载模型

1.仅保存学习到的参数

1.1.保存模型:torch.save(model.state_dict(), PATH)

1.2.调用模型:model.load_state_dict(torch.load(PATH));model.eval()

2.保存整个model

2.1.保存模型:torch.save(model,PATH)

2.2.调用模型:model = torch.load(PATH)

七、model.eval()和with torch.no_grad()的作用和区别

参考此处
在train模式下,dropout网络层会按照设定的参数p设置保留激活单元的概率(保留概率=p); batchnorm层会继续计算数据的mean和var等参数并更新。

在val模式下,dropout层会让所有的激活单元都通过,而batchnorm层会停止计算和更新mean和var,直接使用在训练阶段已经学出的mean和var值

model.eval()中的数据不会进行反向传播,但是仍然需要计算梯度。
with torch.no_grad()中的数据不需要计算梯度,也不会进行反向传播。

可以看到测试要用model.eval()模式,加上with torch.no_grad()能更节省计算资源

八、Copy

赋值:内存地址不变,相当于引用,一改都改。
copy.copy():浅复制,增加元素没影响,但改变共有的元素则原数据也改变。
copy.deepcopy():深复制,就是完全复制,包括内存地址都是新的。

九、微调

参考此处
什么情况下可以微调呢?
(1) 你要使用的数据集和预训练模型的数据集相似
(2) 自己搭建或者使用的CNN模型正确率太低。
(3)数据集相似,但数据集数量太少。
(4)计算资源太少。
根据自己的数据判断是否需要预训练

针对不同情况,也有不同的微调方式:
数据集1 - 数据量少,但数据相似度非常高 - 在这种情况下,我们所做的只是修改最后几层或最终的softmax图层的输出类别。

数据集2 - 数据量少,数据相似度低 - 在这种情况下,我们可以冻结预训练模型的初始层(比如k层),并再次训练剩余的(n-k)层。由于新数据集的相似度较低,因此根据新数据集对较高层进行重新训练具有重要意义。

数据集3 - 数据量大,数据相似度低 - 在这种情况下,由于我们有一个大的数据集,我们的神经网络训练将会很有效。但是,由于我们的数据与用于训练我们的预训练模型的数据相比有很大不同。使用预训练模型进行的预测不会有效。因此,最好根据你的数据从头开始训练神经网络(Training from scatch)

数据集4 - 数据量大,数据相似度高 - 这是理想情况。在这种情况下,预训练模型应该是最有效的。使用模型的最好方法是保留模型的体系结构和模型的初始权重。然后,我们可以使用在预先训练的模型中的权重来重新训练该模型。

1.冻结

参考此处
冻结就是让某些层不反向传播:

for layer in list(model.parameters())[:]:#这里就写你要要冻结的层layer.requires_grad = False #这里不计算梯度
optimizer = optim.Adam(filter(lambda p: p.requires_grad, model.parameters()), lr=0.0001)#过滤掉不需要反向传播的层

解冻:

for layer in list(model.parameters())[:]:layer.requires_grad = Trueoptimizer.add_param_group({'params': layer})

2.修改层

查看model的结构后,得到的是
model(
    (feature):Sequential(
        (0):Conv(
        (conv):Conv2d(3,24,kernel_size=(3,3),stride=(2,2),padding=(1,1),bias=False)
        …
        )
        …
        …
    (fc):Sequantial(
        (0):Dropout(p=0.3,inplace=True)
        (1):Linear(in_features=1792,out_features=1000,bias=True)
        )
    )

比如你要修改fc层,类别从1000改为10:

model.fc = nn.Linear(1792,10)

那么输出的fc层就是
(fc):Sequantial(
    (0):Dropout(p=0.3,inplace=True)
    (1):Linear(in_features=1792,out_features=1000,bias=True)

十、评价指标

参考此处
TP: 预测为1(Positive),实际也为1(Truth-预测对了)
TN: 预测为0(Negative),实际也为0(Truth-预测对了)
FP: 预测为1(Positive),实际为0(False-预测错了)
FN: 预测为0(Negative),实际为1(False-预测错了)
总样本数为:TP+TN+FP+FN

一般直接看到的是准确率Accuracy=(TP+TN)/(TP+TN+FP+FN)

查准率Precision = TP/(TP+FP)

查全率Recall = TP/(TP+FN)

F1 = 2*(PrecisionRecall)/(Precision+Recall)=2TP/(2*TP+FP+FN)
AR = TP/(TP+FP)

CNN的基本概念、常用的计算公式和pytorch代码相关推荐

  1. Git的基本概念/常用命令及实例

    Git的基本概念/常用命令及实例 什么是仓库 在 Git 的概念中,仓库,就是你存在.git目录的那个文件夹内的所有文件,包括隐藏的文件,Git程序会再当前目录以及上级目录查找是否存在.git文件,如 ...

  2. 几个主要的概念常用缓存注解#

    几个主要的概念&常用缓存注解# 名称    解释 Cache    缓存接口,主要实现由 RedisChache, EhCacheCachem , ConcurrentMapCache Cac ...

  3. 常用正则表达式,常用表单验证javascript代码

    常用正则表达式,常用表单验证javascript代码 function f_MobilCheck(as_SourceString) {  if(as_SourceString.match(/^13[0 ...

  4. 基于卷积神经网络(cnn)的手写数字识别(PyTorch)

    目录 1.1 卷积神经网络简介 1.2 神经网络 1.2.1 神经元模型 1.2.2 神经网络模型 1.3 卷积神经网络 1.3.1卷积的概念 1.3.2 卷积的计算过程 1.3.3 感受野 1.3. ...

  5. sap采购申请自动转采购订单_SAP财务常用的MM模块事务代码清单

    SAP是财务业务一体化的软件,各模块信息高度集成.财务人员不仅需要掌握财务模块的操作和原理,还要能够从SAP中查询相关数据,如采购量.销售量.产量等等.本文详细列举了物料管理(MM)模块常用的信息查询 ...

  6. ASP.NET 程序中常用的三十三种代码(1)

    ASP.NET 程序中常用的三十三种代码(1) 1. 打开新的窗口并传送参数: 传送参数: response.write("<script>window.open('*.ASPx ...

  7. 误差分析计算公式及其 matlab 代码实现

    误差分析计算公式及其 matlab 代码实现(mse.mape.rmse等) - 李培冠 - 博客园

  8. 站长常用的200个js代码

    站长常用的200个js代码 1.文本框焦点问题 onBlur:当失去输入焦点后产生该事件 onFocus:当输入获得焦点后,产生该文件 Onchange:当文字值改变时,产生该事件 Onselect: ...

  9. python求反余弦_余弦相似度计算公式:python代码找出相似文章

    余弦相似度计算公式:python代码找出相似文章 用TF-IDF算法可以自动提取关键词.除了找到关键词,怎么找到与原文章相似的其他文章.比如,"百科TA说"在词条最下方,还提供多条 ...

  10. 基于JavaWeb平台的常用物联网硬件接口对接代码总结文档_田超凡

    基于JavaWeb平台的常用物联网硬件接口对接代码总结文档                                                                       ...

最新文章

  1. OSD的主要实现方法和类型(转)
  2. VC++中的通知消息
  3. 阿里云云盾-风险识别-增强版模式发布
  4. 科学家研发机器人混入南极企鹅群 获“友好”对待
  5. 【 Grey Hack 】万金油脚本:常见端口漏洞检测
  6. vs2008配置winddk
  7. MySQL学习(1)
  8. 单目摄像机测距(python+opencv)(转载)
  9. 《孤勇者》matlab版,用matlab弹奏《孤勇者》
  10. js将人民币小写金额转换为大写
  11. 平流方程基于MATLAB数值解法,Matlab微分方程高效解法:谱方法原理与实现
  12. android p小米note3,小米note3|RROS-V7.0|安卓9.0|最强大的自定_最新最全的小米Note3ROM刷机包下载、刷机...
  13. Python学习week5
  14. 开题报告:基于java多用户商城平台系统 毕业设计论文开题报告模板
  15. 机器学习实战-预测数值型数据:回归
  16. 爬虫(三):爬取西刺高匿代理
  17. java.lang.NoSuchFieldError: count at org.eclipse.jface.viewers.ColumnViewer$1.mouseDown
  18. 换脸检测论文 FaceForensics++: Learning to Detect Manipulated Facial Images相关资料
  19. 电子计算机体积,世界上体积最大的计算机
  20. QML进阶(八)实现QML界面与C++类型交互

热门文章

  1. HKC PG27P3Q 评测
  2. PHP 之建行龙支付-被扫(商家扫码客户二维码),扫码枪使用
  3. 智慧能源管控系统在钢铁企业的设计与应用
  4. 用Python模拟QQ界面之QQ登录界面的奥秘
  5. 股基交易额市场份额(VMS)
  6. 土方回填施工方案范本_土方回填施工方案范例(模板)
  7. 【云计算学习教程】云计算的优势和劣势(优点和缺点)分析
  8. PowerApps中应用如何显示用户详细信息
  9. 原生 android 手机,三部具有原生安卓系统的旗舰手机,一部比一部漂亮
  10. 带键盘计算机,怎么屏蔽笔记本自带键盘