图像处理-特征融合:相加、拼接、Attention
目录
前言
1 低层/高层特征
2 早/晚融合-Concat/Add
3 Attention特征融合
前言
特征融合是指来自不同层或分支的特征的组合,是现代网络体系结构中很常见的一种操作。图像处理的特征融合中,对于普遍的多尺度融合,广泛操作是直接将他们相加或者拼接起来!即通常通过简单的操作(例如求和或串联)来实现,但是,这不一定是最佳选择。随着Transformer在计算机视觉领域的快速发展,基于Attention的特征融合也占据一片天地!即注意力特征融合,该方案适用于大多数常见场景,包括由short and long skip connections以及在Inception层内的特征融合。
【相关学习资源】
深度特征融合---高低层(多尺度)特征融合
Attentional Feature Fusion 特征融合方法
深度学习论文: Attentional Feature Fusion及其PyTorch实现
【Attention】深入理解Attention机制
目前主流的attention方法都有哪些?
1 低层/高层特征
图像处理中,融合不同尺度的特征是提高图像效果的重要手段,在卷积中:
低层特征:低层特征分辨率更高,包含更多位置、细节信息,但是由于经过的卷积更少,其语义性更低,噪声更多。
高层特征:高层特征具有更强的语义信息,但是分辨率很低,对细节的感知能力较差。
如何将两者高效融合,是改善模型的关键。
2 早/晚融合-Concat/Add
很多工作通过融合多层来提升性能,按照融合与预测的先后顺序,分类为早融合(Early fusion)和晚融合(Late fusion)。
早融合(Early fusion): 先融合多层的特征,然后在融合后的特征上训练预测器(只在完全融合之后,才统一进行检测)。这类方法也被称为skip connection,即采用concat、add操作。这一思路的代表是Inside-Outside Net(ION)和HyperNet。 两个经典的特征融合方法:
- Concat:系列特征融合,直接将两个特征进行连接。两个输入特征x和y的维数若为p和q,输出特征z的维数为p+q;
- Add:并行策略,将这两个特征向量组合成复向量,对于输入特征x和y,z = x + iy,其中i是虚数单位。
晚融合(Late fusion):通过结合不同层的检测结果改进检测性能(尚未完成最终的融合之前,在部分融合的层上就开始进行检测,会有多层的检测,最终将多个检测结果进行融合)。这一类研究思路的代表有两种:
- Feature不融合,多尺度的feture分别进行预测,然后对预测结果进行综合,如Single Shot MultiBox Detector (SSD) , Multi-scale CNN(MS-CNN)
- Feature进行金字塔融合,融合后进行预测,如Feature Pyramid Network(FPN)等。
3 Attention特征融合
Attention机制:
学习权重分布:输入数据或特征图上的不同部分对应的专注度不同,对此Jason Zhao在知乎回答中概括得很好,大体如下:
- 这个加权可以是保留所有分量均做加权(即soft attention);也可以是在分布中以某种采样策略选取部分分量(即hard attention),此时常用RL来做。这个加权可以作用在原图上,也就是《Recurrent Model of Visual Attention》(RAM)和《Multiple Object Recognition with Visual Attention》(DRAM);也可以作用在特征图上,如后续的好多文章(例如image caption中的《 Show, Attend and Tell: Neural Image Caption Generation with Visual Attention》)。这个加权可以作用在空间尺度上,给不同空间区域加权;也可以作用在channel尺度上,给不同通道特征加权;甚至特征图上每个元素加权。 这个加权还可以作用在不同时刻历史特征上,如Machine Translation。
任务聚焦:通过将任务分解,设计不同的网络结构(或分支)专注于不同的子任务,重新分配网络的学习能力,从而降低原始任务的难度,使网络更加容易训练。
目前,利用注意力的方法进行特征融合的方法屡见不鲜,此处重在罗列一些思路:
- SENet:计算attention的方式,将每个通道的像素值做一个平均后,经过一系列操作,用sigmoid函数归一化。优缺:大尺度目标有效,小尺度目标效果差。
- MS-CAM:计算attentionde方式,提出的多尺度通道注意力模块用于更好地融合语义和尺度不一致的特征;通过添加另一个注意力级别(称为迭代关注特征融合)来缓解特征图的初始集成可能带来的问题。
后续特征融合,应进一步结合代码分析学习!
图像处理-特征融合:相加、拼接、Attention相关推荐
- 深度学习跨层网络结构--特征融合
网络连接结构 个人理解,如有偏差,欢迎指出. ResNet ResNet ResNet 为了解决模型退化问题,创新性的使用了恒等映射,将上一层可能不需要改变的信息,通过跨层链接以逐个相加的方式,叠加到 ...
- FFA-Net: Feature Fusion Attention Network for Single Image Dehazing (AAAI 2020)用于单图像去叠的特征融合注意力网络
用于单图像去叠的特征融合注意力网络 https://arxiv.org/pdf/1911.07559.pdf Xu Qin1*Zhilin Wang2∗Yuanchao Bai1Xiaodong Xi ...
- 【深度学习】特征融合的重要方法 | 张量的拼接 | torch.cat()函数 | torch.add(函数
文章目录 前言 一.torch.cat()函数 拼接只存在h,w(高,宽)的图像 二.torch.cat() 拼接存在c,h,w(通道,高,宽)的图像 三.torch.add()使张量对应元素直接相加 ...
- 用于视觉问答的基于关系推理和注意力的多峰特征融合模型《Multimodal feature fusion by relational reasoning and attention for VQA》
目录 一.文献摘要介绍 二.网络框架介绍 三.实验分析 四.结论 这是视觉问答论文阅读的系列笔记之一,本文有点长,请耐心阅读,定会有收货.如有不足,随时欢迎交流和探讨. 一.文献摘要介绍 The re ...
- 目标检测中特征融合技术(YOLO v4)(上)
目标检测中特征融合技术(YOLO v4)(上) 论文链接:https://arxiv.org/abs/1612.03144 Feature Pyramid Networks for Object De ...
- 目标检测 | 盘点目标检测中的特征融合技巧(根据YOLO v4总结)
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 特征融合分类 在深度学习的很多工作中(例如目标检测.图像分割),融 ...
- CNN中特征融合的一些策略
Introduction 特征融合的方法很多.如果数学化地表示,大体可以分为以下几种: X+Y\textbf{X}+\textbf{Y}X+Y: X\textbf{X}X.Y\textbf{Y}Y表示 ...
- 目标检测中特征融合技术(YOLO v4)(下)
目标检测中特征融合技术(YOLO v4)(下) ASFF:自适应特征融合方式 ASFF来自论文:<Learning Spatial Fusion for Single-Shot Object D ...
- concat特征融合_深度特征融合---理解add和concat之多层特征融合
一.如何理解concat和add的方式融合特征 在各个网络模型中,ResNet,FPN等采用的element-wise add来融合特征,而DenseNet等则采用concat来融合特征.那add与c ...
最新文章
- MDA:模型驱动架构 简介
- jupyter kernel_jupyter增加多版本python内核
- beyond compare 3.10在异常关机后无法启动
- 推荐常用算法之-基于内容的推荐(转自-BreezeDeus博主)
- 新兴机器学习算法:在线学习
- Effective C#(二)
- 栈出现的异常和设置栈的大小-Xss
- 动物行为检测计算机视觉_基于红外热成像和计算机视觉的动物行为研究系统便是其中一例...
- Python爬虫偷懒神器 — 快速构造请求头!
- 什么是信息系统安全等级保护
- idea创建Maven项目后启动报404
- 7种提高工作效率的Vim操作
- 打java包需要对应服务器么_java打war包、部署服务器
- win10三国志14已停止工作解决方法--win10专业版
- 最常用的 Linux 命令都不会,你怎么敢去面试?
- HDU 4544 湫湫系列故事——消灭兔子 (贪心+优先队列)
- React有哪些性能优化的手段?
- Hacker_kid靶机打靶过程及思路
- 341-Linux 连接数据库
- OCR-Tesseract系列学习——Tesseract for Linux下载与安装
热门文章
- 台式计算机cpu扣不下去,台式机cpu是不是可以随便更换
- 不同VLAN下实现网络互相通信(配置port trunk pvid vlan进行数据转发)
- Win11安装VScode详细教程、配置Anaconda与python环境
- 小程序如何显示群名称?
- seo原创文章五种方法迎合搜索引擎收录和排名
- 还在纠结选择用什么浏览器?手机端用国产浏览器也很香
- 计算机科学主题 一亩三分地 考试 中心 满分95大米 (只适用于2019年 之后注册的新人) 答案
- 九度 题目1421:Abor
- Esri携“新一代Web GIS”亮相中国地理信息产业大会
- DDR4的内存计算方法