对于基于深度学习的分类算法,其关键不仅在于提取与标签相关的目标信息,剔除无关的信息也是非常重要的,所以要在深度神经网络中引入软阈值化。阈值的自动设置,是深度残差收缩网络的核心贡献。需要注意的是,软阈值化中的阈值,需要满足一定的条件。这篇文章中的阈值设置,事实上,是在注意力机制下进行的。下面分别介绍阈值需要满足的条件、注意力机制以及具体的阈值设置方法。

(1)阈值需要满足的条件

  在软阈值化中,阈值的取值有一定的要求:首先,阈值必须是正数;其次,阈值不能太大,否则输出会全部为零

  更重要的是,每个样本,应该有不同的阈值。这是因为,许多样本所含的噪声量经常是不同的。

  例如,样本A所含噪声较少,样本B所含噪声较多。那么,在降噪算法里面,样本A的阈值就应该大一点,样本B的阈值就应该小一些(不要搞反)。在深度学习算法里,由于这些特征没有明确的物理意义,阈值的大小也无法得到解释。但是道理是相通的,即每个样本应该有不同的阈值。

(2)注意力机制

  注意力机制可以从视觉的角度进行解释。人类能够通过快速扫描图像,发现目标物体,进而将更多的注意力集中在目标物体上,以捕获更多细节,同时抑制其他区域的无关信息。

其实就是不同的样本得到不同的阈值,然后一个样本的不同通道拥有不同的权重

  Squeeze-and-Excitation Network(SENet)是一种典型的带有注意力机制的深度学习方法。对于不同的样本,不同通道上的特征,在分类任务中的重要程度,经常是不同的。SENet可以学习一组权重,自动地调整不同通道的特征的大小。这个过程,就相当于施加不同的注意力在各个通道的特征上(见下图)。

  需要注意的是,每个样本,都有自己独特的一组权重。任意两个样本,它们的这些权重,都是不同的。在SENet中,具体的网络结构如下图所示。学习权重的路径就是,全局池化→全连接层→ReLU→全连接层→Sigmoid。

(3)具体的阈值设置方法

  深度残差收缩网络采用了一个子网络来自动地设置阈值。这个子网络的结构,就借鉴了上述的SENet。

  首先来看“通道之间共享阈值的深度残差收缩网络(Deep Residual Shrinkage Networks with Channel-shared Thresholds,简称DRSN-CS)”。我们可以看到,在红色虚线框里的子网络,学习得到了一个阈值,应用在特征图的所有通道上。

在这个子网络中,首先对输入特征图内的所有元素,取绝对值。
然后经过全局均值池化(Global Average Pooling, GAP)和求平均(Average),就得到了一个特征。为了方便描述,将这个特征记为A。
在另一条路径中,全局均值池化之后的特征,输入到一个小型的全连接网络之中。这个全连接网络以一个Sigmoid激活函数作为最后一步,其目的在于将输出调整到0和1之间,记为α。最终的阈值就是α×A。
这样的话,阈值就是,一个0和1之间的数字×特征图的绝对值的平均值。通过这种方式,保证了阈值不仅为正数,而且不会太大。

  然后再看“逐通道不同阈值的深度残差收缩网络(Deep Residual Shrinkage Networks with Channel-wise Thresholds,简称DRSN-CW)”。与上述的DRSN-CS相似,在红色虚线框里的子网络,学习得到了一组阈值。以相同的方式,确保了阈值有着合适的取值范围。

  值得指出的是,通过这种方式,不同的样本就有了不同的阈值。在一定程度上,也可以理解为一种注意力机制:注意到不重要的特征,将它们剔除掉;或者说,注意到重要的特征,将它们保留下来。另外,虽然跨层的恒等路径(Identity shortcut)将不重要的特征也传递到了高层特征中,但是通过很多残差模块的堆叠,这些不重要的特征所占的比重越来越低,最终实现不重要特征的消除。

深度残差收缩网络:(四)注意力机制下的阈值设置相关推荐

  1. 深度残差收缩网络:借助注意力机制实现特征的软阈值化

    作者 | 哈尔滨工业大学(威海)讲师 赵明航 本文解读了一种新的深度注意力算法,即深度残差收缩网络(Deep Residual Shrinkage Network). 从功能上讲,深度残差收缩网络是一 ...

  2. 深度残差网络_注意力机制+软阈值化=深度残差收缩网络

    顾名思义,深度残差收缩网络是由"残差网络"和"收缩"两部分所组成的,是在"残差网络"基础上的一种改进算法. 其中,残差网络在2016年斩获了 ...

  3. 注意力机制+软阈值化 = 深度残差收缩网络(Deep Residual Shrinkage Network)

    目录 1. 相关基础 1.1 残差网络 1.2 软阈值化 1.3 注意力机制 2. 深度残差收缩网络理论 2.1 动机 2.2 算法实现 2.3 优势 结论 顾名思义,深度残差收缩网络是由" ...

  4. 注意力机制+软阈值函数=深度残差收缩网络(附代码)

    深度残差收缩网络是一种面向强噪声数据的深度神经网络,是由"深度残差网络"和"收缩"组成的.一方面,"深度残差网络"已经成为了深度学习领域的基 ...

  5. 注意力机制、深度残差网络和软阈值化的集成:深度残差收缩网络(附代码)

    深度残差收缩网络是一种针对强噪声数据的深度学习方法,是由"深度残差网络"和"收缩"组成的.一方面,"深度残差网络"已经成为了深度学习领域的基 ...

  6. 深度残差收缩网络:(一)背景知识

    总共六篇文章: 深度残差收缩网络:(一)背景知识 深度残差收缩网络:(一)背景知识_马鹏森的博客-CSDN博客 深度残差收缩网络:(二)整体思路 深度残差收缩网络:(二)整体思路_马鹏森的博客-CSD ...

  7. 论文翻译-基于深度残差收缩网络的故障诊断 Deep Residual Shrinkage Networks for Fault Diagnosis

    深度残差收缩网络是深度残差网络的一种改进,针对的是数据中含有噪声或冗余信息的情况,将软阈值化引入深度残差网络的内部,通过消除冗余特征,增强高层特征的判别性.以下对部分论文原文进行了翻译,仅以学习为目的 ...

  8. 深度残差收缩网络简要解读

    深度残差收缩网络是深度残差网络的一种新的升级版本,其实是深度残差网络.注意力机制和软阈值化的深度集成. 在一定程度上,深度残差收缩网络的工作原理,可以理解为:通过注意力机制注意到不重要的特征,然后通过 ...

  9. 基于深度残差收缩网络的故障诊断 Deep Residual Shrinkage Networks for Fault Diagnosis

    深度残差收缩网络针对的是数据中含有噪声或冗余信息的情况,是深度残差网络的一种改进,将软阈值化引入深度残差网络的内部,通过消除冗余特征,增强高层特征的判别性.以下对部分论文原文进行了翻译,仅以学习为目的 ...

最新文章

  1. tidb mysql 协议_TiDB源码阅读(二) TiDB中的MySQL协议
  2. 【控制】《自动控制原理》胡寿松老师-第4章-线性系统的根轨迹法
  3. 正式突破两千粉丝!开心!
  4. 服务器开机提示修复,电脑开机提示自动修复怎么办?win10电脑开机提示自动修复教程...
  5. ElasticSearch--Jdbc导入插件
  6. C# 匿名对象(匿名类型)、var、动态类型 dynamic
  7. visual studio配置opencv
  8. 项目介绍star原理_这个Python项目厉害了!多个实战案例教你分析时空数据处理...
  9. 基于云计算的数字化业务系统安全工程
  10. Pubmedy加载时显示程序包无效的解决方案
  11. 【超详细】随机变量及其分布——《概率论与数理统计》第二章学习笔记
  12. 流媒体协议:互联网视频分发协议介绍(渐进式、HLS、DASH、HDS、RTMP协议)
  13. Android 报错:Entry name 'AndroidManifest.xml' collided
  14. xcode联调设备出现“ ineligible Device”解决
  15. 使用宏基因组的方法快速鉴定新冠病毒SARS-CoV2
  16. 呼吸机氧电池的工作原理及性能检测
  17. ps无法启动因为计算机中丢失api ms,解决win8下ps提示“丢失api-ms-win-crt-runtime-l1-1-0.dll”的方法...
  18. 视觉错觉的举例------------善于发现生活中的
  19. springMVC+WebUploader实现多图片上传
  20. MailKit和MimeKit 收发邮件

热门文章

  1. 开发指南专题七:JEECG微云快速开发平台查询HQL过滤器
  2. eclipse中为了format的代码更加好看,少换行,可以设置java、xml、jsp的代码line width。
  3. Eclipse设置:背景与字体大小和xml文件中字体大小调整
  4. Linux IPC实践(4) --System V消息队列(1)
  5. Makefile学习(一)[第二版]
  6. hadoop--MapReduce_WordCount词频统计案例
  7. IDEA 自动生成 serialVersionUID 的设置
  8. 【转】Elasticsearch5.0 安装问题集锦
  9. linux shell取变量的子串26种方法实践
  10. JavaScript 秘密花园[转]