HALCON 21.11:深度学习笔记---有监督训练(6)

HALCON 21.11.0.0中,实现了深度学习方法。不同的DL方法有不同的结果。相应地,它们也使用不同的衡量标准来确定网络的“表现如何”。在训练一个网络时,不同的模型会有不同的行为和缺陷,我们将在这里进行描述。

训练中的验证

当涉及到网络性能验证时,需要注意的是,这不是一个纯粹的优化问题(参见上面的“网络和训练过程”和“设置训练参数”部分)。

为了观察训练过程,通常可视化验证措施是有帮助的,例如,对于分类网络的训练,批样本的误差。由于样本不同,分配任务的难度也可能不同。因此,对于给定批的样本,网络的性能可能比对于另一批的样本更好或更差。因此,验证度量在迭代过程中不会平稳地改变是很正常的。但总的来说,它应该有所改善。调整超参数'learning_rate'和'momentum'可以帮助再次改进验证度量。下面的图显示了可能的场景。

Sketch of an validation measure during training, here using the error from classification as example

(1) General tendencies for possible outcomes with different 'learning_rate' values. dark blue: good learning rate; gray: very high learning rate; light blue: high learning rate, orange: low learning rate

(2) Ideal case with a learning rate policy to reduce the 'learning_rate' value after a given number of iterations. In orange: training error, dark blue: validation error. The arrow marks the iteration, at which the learning rate is decreased.

欠拟合和过拟合的风险

如果模型不能捕获任务的复杂性,就会发生欠拟合。这直接反映在训练集的验证测度上,该测度保持较高水平。

当网络开始“记忆”训练数据,而不是学习如何归纳时,就会发生过拟合。这可以通过训练集上的验证度量来证明,此时验证集上的验证度量变差,而训练集上的验证度量保持良好甚至有所改善。在这种情况下,正则化可能会有所帮助。请参阅“设置训练参数:超参数”一节中对超参数“weight_prior”的解释。请注意,当模型容量相对于数据过高时,也会出现类似的现象。

Sketch of a possible overfitting scenario, visible on the generalization gap (indicated with the arrow). The error from classification serves as an example for a validation measure.

混淆矩阵(Confusion Matrix)

一个网络为一个实例推断出一个顶级预测,即推断出最高亲和力的类。当我们知道了它的ground truth class,我们可以比较两个类的关系:预测值和正确值。因此,实例在不同类型的方法之间是不同的,例如,在分类实例是图像,在语义分割实例是单个像素。

当两个以上的类被区分时,也可以将比较化为二值问题。这意味着,对于一个给定的类,你只需要比较它是相同的类(正数)还是任何其他类(负数)。对于这种二元分类问题,比较被简化为以下四种可能的实体(其中并不是所有的都适用于每一种方法):

  1. 真阳性(TP:预测阳性,标记阳性)
  2. 真阴性(TN:预测阴性,标记阴性)
  3. 假阳性(FP:预测阳性,标记阴性)
  4. 假阴性(FN:预测阴性,标记阳性)

混淆矩阵就是具有这种比较的表格。通过这个表可以很容易地看到网络对每个类的性能。

对于每个类,它列出了预测到哪个类的实例的数量。例如,对于区分“苹果”、“桃子”和“橘子”这三个类别的分类器,混淆矩阵显示了有多少带有ground truth class从属关系的“苹果”被分类为“苹果”以及有多少被分类为“桃子”或“橘子”。当然,这也列出了其他类。这个例子如下图所示。在HALCON中,我们在一列中为每个类表示带有这个ground truth标签的实例,并在一行中预测属于这个类的实例。

An example for a confusion matrices from classification. We see that 68 images of an 'apple' have been classified as such (TP), 60 images showing not an 'apple' have been correctly classified as a 'peach' (30) or 'pear' (30) (TN), 0 images show a 'peach' or a 'pear' but have been classified as an 'apple' (FP) and 24 images of an 'apple' have wrongly been classified as 'peach' (21) or 'pear' (3) (FN). (1) A confusion matrix for all three distinguished classes. It appears as if the network 'confuses' apples and peaches more than all other combinations. (2) The confusion matrix of the binary problem to better visualize the 'apple' class.

HALCON 21.11:深度学习笔记---有监督训练(6)相关推荐

  1. HALCON 21.11:学习笔记---OPC_UA(I/O)

    HALCON 21.11:学习笔记---OPC_UA(I/O) 本章主要提供有关OPC_UA的信息. 系统要求 Intel compatible PC with Windows 7 (32-bit o ...

  2. HALCON 21.11:深度学习笔记---网络和训练过程(4)

    HALCON 21.11:深度学习笔记---网络和训练过程(4) HALCON 21.11.0.0中,实现了深度学习方法.关于网络和训练过程如下: 在深度学习中,任务是通过网络发送输入图像来执行的.整 ...

  3. HALCON 20.11:学习笔记---一维测量(Measuring)

    HALCON 20.11:学习笔记---一维测量(Measuring) 本章主要提供有关一维测量的信息. 一维测量的概念 通过一维测量可以沿着预定义的线或弧定位从亮到暗或从暗到亮的过渡边缘.这使您可以 ...

  4. halcon 21.05深度学习下载和安装

    halcon21版本下载连接地址: 链接:https://pan.baidu.com/s/142qWteiIgHm6QuZVOkX_pw?pwd=2tw5 提取码:2tw5 下载后目录如下: 下载完毕 ...

  5. 《深度学习笔记》——在训练过程中出现nan的调试笔记

    1 出现nan的理论分析 从本质上来说,"出现nan"现象主要是因为数值超出当前数据类型的表示范围,其含义是指"Not a Number",常在浮点数运算中出现 ...

  6. HALCON 21.11:深度学习笔记---语义分割/边缘提取(12)

    HALCON 21.11:深度学习笔记---语义分割/边缘提取(12) HALCON 21.11.0.0中,实现了深度学习方法. 本章介绍了如何使用基于深度学习的语义分割,包括训练和推理阶段. 通过语 ...

  7. HALCON 20.11:深度学习笔记(6)---有监督训练

    HALCON 20.11:深度学习笔记(6)---有监督训练 HALCON 20.11.0.0中,实现了深度学习方法.不同的DL方法有不同的结果.相应地,它们也使用不同的测量方法来确定网络的" ...

  8. HALCON 21.11:深度学习笔记---对象检测, 实例分割(11)

    HALCON 21.11:深度学习笔记---对象检测, 实例分割(11) HALCON 21.11.0.0中,实现了深度学习方法. 本章介绍了如何使用基于深度学习的对象检测. 通过对象检测,我们希望在 ...

  9. HALCON 21.11:深度学习笔记---分类(10)

    HALCON 21.11:深度学习笔记---分类(10) HALCON 21.11.0.0中,实现了深度学习方法. 本章介绍了如何在训练和推理阶段使用基于深度学习的分类. 基于深度学习的分类是一种对一 ...

最新文章

  1. 图像数据增强(平移,旋转,亮度变换,翻转,添加高斯噪声,缩放,裁剪)
  2. 在Swift中如何使用C中的Struct
  3. 【转】C#获取当前路径7种方法
  4. 读写分离和负载均衡介绍
  5. 2019手卫生定义_2021年卫生资格考试部分科目大纲和教材变化归总!
  6. 数据结构之选择排序:堆排序
  7. 迁移程序mysql_程序从MYSQL迁移ORACLE注意事项之二
  8. 没有电脑却想运行代码?有手机就够了
  9. java实现递归算法
  10. 华为手机解锁码计算工具_华为解锁码-华为解锁助手(华为手机一键解锁工具)v1.0.0.0 快速版-东坡下载...
  11. Xilinx 7系列FPGA DDR3硬件设计规则
  12. google如何恢复误删除书签
  13. Vue入门 computer计算属性
  14. 如何用尺规作图画圆的切线_尺规作图过圆外一点作圆的切线的四种方法
  15. 十款免费的Web前端开发工具
  16. 高速公路交警的经验之谈[转自QQ群]
  17. java 内存很高_Java服务器内存和CPU占用过高的原因
  18. knex简单的增删改查
  19. Linux三剑客之awk最佳实践
  20. 社群团购到底有哪些优势?为什么社群团购很容易打造爆品?

热门文章

  1. 思考题1(雇员、部门、领导)
  2. pytest.5.参数化的Fixture
  3. js生成vCard,以及格式参数详细说明
  4. MySQL版本升级5.6到5.7版本
  5. 递推DP URAL 1119 Metro
  6. html%3cform%3e不换行,HTML URL 编码
  7. 最为完整的gdb调试
  8. ArrayList如何实现增删元素及其缺陷
  9. 延禧宫有刺客!快把他收了!
  10. android 项目 功能 源码 eclipse的