作者 | 哈尔滨工业大学(威海)讲师 赵明航

本文解读了一种新的深度注意力算法,即深度残差收缩网络(Deep Residual Shrinkage Network)。

从功能上讲,深度残差收缩网络是一种面向强噪声或者高度冗余数据的特征学习方法。本文首先回顾了相关基础知识,然后介绍了深度残差收缩网络的动机和具体实现,希望对大家有所帮助

相关基础

深度残差收缩网络主要建立在三个部分的基础之上:深度残差网络、软阈值函数和注意力机制。

1.1 深度残差网络

深度残差网络无疑是近年来最成功的深度学习算法之一,在谷歌学术上的引用已经突破四万次。相较于普通的卷积神经网络,深度残差网络采用跨层恒等路径的方式,缓解了深层网络的训练难度。

深度残差网络的主干部分是由很多残差模块堆叠而成的,其中一种常见的残差模块如下图所示。

1.2 软阈值函数

软阈值函数是大部分降噪方法的核心步骤。首先,我们需要设置一个正数阈值。该阈值不能太大,即不能大于输入数据绝对值的最大值,否则输出会全部为零。

然后,软阈值函数会将绝对值低于这个阈值的输入数据设置为零,并且将绝对值大于这个阈值的输入数据也朝着零收缩,其输入与输出的关系如下图 (a) 所示。

软阈值函数的输出 y 对输入 x 的导数如上图 (b) 所示。我们可以发现,其导数要么取值为 0,要么取值为 1。从这个角度看的话,软阈值函数和 ReLU 激活函数有一定的相似之处,也有利于深度学习算法训练时梯度的反向传播。

值得注意的是,阈值的选取对软阈值函数的结果有着直接的影响,至今仍是一个难题。

1.3注意力机制

注意力机制是近年来深度学习领域的超级研究热点,而 Squeeze-and-Excitation Network (SENet)则是最为经典的注意力算法之一。

如下图所示,SENet 通过一个小型网络学习得到一组权值系数,用于各个特征通道的加权。这其实是一种注意力机制:首先评估各个特征通道的重要程度,然后根据其重要程度赋予各个特征通道合适的权重。

如下图所示,SENet 可以与残差模块集成在一起。在这种模式下,由于跨层恒等路径的存在,SENet 可以更容易得到训练。另外,值得指出的是,每个样本的权值系数都是根据其自身设置的;也就是说,每个样本都可以有自己独特的一组权值系数。

深度残差收缩网络

接下来,本部分针对深度残差收缩网络的动机、实现、优势和验证,分别展开了介绍。

2.1 动机

首先,大部分现实世界中的数据,包括图片、语音或者振动,都或多或少地含有噪声或者冗余信息。

从广义上讲,在一个样本里面,任何与当前模式识别任务无关的信息,都可以被认为是噪声或者冗余信息。这些噪声或者冗余信息很可能会对当前的模式识别任务造成不利的影响。

其次,对于任意的两个样本,它们的噪声或冗余含量经常是不同的。换言之,有些样本所含的噪声或冗余要多一些,有些要少一些。这就要求我们在设计算法的时候,应该使算法具备根据每个样本的特点、单独设置相关参数的能力。

在上述两点的驱动下,我们能不能将传统信号降噪算法中的软阈值函数引入深度残差网络之中呢?软阈值函数中的阈值应该怎样选取呢?深度残差收缩网络就给出了一种答案。

2.2 实现

深度残差收缩网络融合了深度残差网络、SENet 和软阈值函数。如下图所示,深度残差收缩网络就是将残差模式下的 SENet 中的“重新加权”替换成了“软阈值化”。

在 SENet 中,所嵌入的小型网络是用于获取一组权值系数;在深度残差收缩网络中,该小型网络则是用于获取一组阈值。

为了获得合适的阈值,相较于原始的 SENet,深度残差收缩网络里面的小型网络的结构也进行了调整。具体而言,该小型网络所输出的阈值,是(各个特征通道的绝对值的平均值)×(一组 0 和 1 之间的系数)。

通过这种方式,深度残差收缩网络不仅确保了所有阈值都为正数,而且阈值不会太大(不会使所有输出都为 0)。

如下图所示,深度残差收缩网络的整体结构与普通的深度残差网络是一致的,包含了输入层、刚开始的卷积层、一系列的基本模块以及最后的全局均值池化和全连接输出层等。

2.3 优势

首先,软阈值函数所需要的阈值,是通过一个小型网络自动设置的,避免了人工设置阈值所需要的专业知识。

然后,深度残差收缩网络确保了软阈值函数的阈值为正数,而且在合适的取值范围之内,避免了输出全部为零的情况。

同时,每个样本都有自己独特的一组阈值,使得深度残差收缩网络适用于各个样本的噪声含量不同的情况。

结论

由于噪声或者冗余信息是无处不在的,深度残差收缩网络,或者说这种“注意力机制”+“软阈值函数”的思路,或许有着广阔的拓展空间和应用范围。

论文链接:

https://www.paperweekly.site/papers/3397

代码链接:

https://github.com/zhao62/Deep-Residual-Shrinkage-Networks

【end】

对存在潜伏期的新冠肺炎,快速分析其传染关系及接触关系,积极采取隔离、观察和治疗措施是非常有利的防控疫情的科学防控依据。

周四(明晚)20点,我们一起来看Sophon KG如何追寻新冠病毒轨迹,运用AI技术、工具建立相关知识图谱,通过确诊案例的亲属、同事和朋友的关系网找出密切接触者进行及时隔离,同时刻画出确诊案例的活动轨迹,找到其关系网之外的密切接触者及病毒可能的“行凶环境”。

推荐阅读

  • 百万人学AI:CSDN重磅共建人工智能技术新生态

  • 154万AI开发者用数据告诉你,中国AI如何才能弯道超车?

  • 技术大佬的肺腑之言:“不要为了AI而AI”!| 刷新 CTO

  • 悼念前端大牛司徒正美

  • 业内最大的“空气币”——以太坊?

  • Spark3.0发布了,代码拉过来,打个包,跑起来!

你点的每个“在看”,我都认真当成了AI

深度残差网络_深度残差收缩网络:借助注意力机制实现特征的软阈值化相关推荐

  1. 深度残差收缩网络:借助注意力机制实现特征的软阈值化

    作者 | 哈尔滨工业大学(威海)讲师 赵明航 本文解读了一种新的深度注意力算法,即深度残差收缩网络(Deep Residual Shrinkage Network). 从功能上讲,深度残差收缩网络是一 ...

  2. 注意力机制+软阈值化 = 深度残差收缩网络(Deep Residual Shrinkage Network)

    目录 1. 相关基础 1.1 残差网络 1.2 软阈值化 1.3 注意力机制 2. 深度残差收缩网络理论 2.1 动机 2.2 算法实现 2.3 优势 结论 顾名思义,深度残差收缩网络是由" ...

  3. 深度残差网络_注意力机制+软阈值化=深度残差收缩网络

    顾名思义,深度残差收缩网络是由"残差网络"和"收缩"两部分所组成的,是在"残差网络"基础上的一种改进算法. 其中,残差网络在2016年斩获了 ...

  4. 深度残差网络_深度残差收缩网络:(三) 网络结构

    1. 回顾一下深度残差网络的结构 在下图中,(a)-(c)分别是三种残差模块,(d)是深度残差网络的整体示意图.BN指的是批标准化(Batch Normalization),ReLU指的是整流线性单元 ...

  5. 注意力机制、深度残差网络和软阈值化的集成:深度残差收缩网络(附代码)

    深度残差收缩网络是一种针对强噪声数据的深度学习方法,是由"深度残差网络"和"收缩"组成的.一方面,"深度残差网络"已经成为了深度学习领域的基 ...

  6. 深度学习深度前馈网络_深度学习前馈网络中的讲义第4部分

    深度学习深度前馈网络 FAU深度学习讲义 (FAU Lecture Notes in Deep Learning) These are the lecture notes for FAU's YouT ...

  7. YOLOv4(2)-BN改进、网络感受野增强技巧、注意力机制、特征融合技巧

    前言 此篇文章转载于知乎,系列文章地址:https://zhuanlan.zhihu.com/p/141533907 yolov4:YOLOv4: Optimal Speed and Accuracy ...

  8. python实现胶囊网络_深度学习精要之CapsuleNets理论与实践(附Python代码)

    摘要: 本文对胶囊网络进行了非技术性的简要概括,分析了其两个重要属性,之后针对MNIST手写体数据集上验证多层感知机.卷积神经网络以及胶囊网络的性能. 神经网络于上世纪50年代提出,直到最近十年里才得 ...

  9. 深度学习深度前馈网络_深度学习前馈网络中的讲义第1部分

    深度学习深度前馈网络 FAU深度学习讲义 (FAU Lecture Notes in Deep Learning) These are the lecture notes for FAU's YouT ...

  10. 深度学习 图像分类_深度学习时代您应该阅读的10篇文章了解图像分类

    深度学习 图像分类 前言 (Foreword) Computer vision is a subject to convert images and videos into machine-under ...

最新文章

  1. Asp.net开发过程中,我们会遇到很多Exception
  2. BZOJ Tyvj 1729 文艺平衡树
  3. 机器学习--聚类系列--层次聚类
  4. 图元和片元_OpenGL中的顶点、 图元、片元、像素的含义
  5. PAT 甲级 1027 Colors in Mars
  6. 牛客 - Subset of Five(背包)
  7. pdf转图片 java_有将pdf文件转图片的格式方法吗?
  8. 有关EMMC、Nandflash、SSD、HDD的科普类说明
  9. cisco LAP upgrade to Fat AP
  10. CSO安全手册中的七条守则
  11. 机器人绳索英雄下载苹果手机_机器人绳索英雄
  12. error汇总:dpkg: error processing package *** (--configure)
  13. 巧妇难为无米之炊 走出软件测试的困境
  14. 关于在EF中通用方法
  15. iconv 中文截断问题的解决方法
  16. python实现随机森林
  17. mbp touchbar设置_macbookpro touchbar 怎么添加锁屏快捷键
  18. 第四篇:ROS常用命令行指令【重点】
  19. Ubuntu 16.04 VCS+Verdi安装总结
  20. 周末imac机重装win7,装得我抓狂

热门文章

  1. Python网络爬虫数据抓取思路,静态与动态页面爬取思路,爬虫框架等
  2. 2017年电子设计大赛(B题 滚球控制系统)赛后总结
  3. Eclipse解压后打开报错javaw.exe in your current PATH
  4. 信鸽 ios tag推送 php,信鸽推送(iOS)踩过的坑
  5. word自带公式编辑_原来有这样几种方式打开Word中的公式编辑器
  6. 服务器数字显示器,数字显示器
  7. android_5.0简介
  8. word2vec中的数学原理详解
  9. 华北电力大学\华电计算机考研复试经验分享
  10. ixigua解析_最新西瓜视频、今日头条视频地址解析获取API接口