论文阅读训练(13)
《Pixel-Adaptive Convolutional Neural Networks》(2019)
作者:UMass Amherst NVIDIA
摘要
卷积是CNN的基础组成block,被广泛使用的主要原因是它们的权重是空间共享的,也是最主要的限制,是使得卷积是内容无关的。此篇文章提出一个像素自适应的卷积操作,简称(PAC),对标准卷积的简单有效修改,其中滤波器权重乘以空间变化的内核,变化内核取决于可学习的、局部像素特征。PAC是几个有名的滤波技术的泛化,因此可以广范使用。具体的,证明当PAC用于deep joint image upsampling(深联合图像上采样)性能最好。PAC也可以对全连接CRF提供迭代,称为PAC-CRF,比Full-CRF更快。除此之外,PAC可用作预训练网络中卷积层的直接替代,从而实现一致的性能改进。
问题:处理卷积由于空间共享使得内容无关的限制。
方法:提出像素自适应卷积操作(PCA),对标准卷积的简单有效修改,其中滤波器权重乘以空间变化的内核,变化内核取决于可学习的、局部像素特征。
自适应核K用预训练或学习的特征构建,输入V,操作:逐像素相乘求和。
效果:PAC是滤波器的泛化,可将预训练网络中的卷积层直接替换。
《Learning Region Features for Object Detection》(ECCV2018)
作者:Han Hu胡瀚(MSRA)【研究变形卷积、关系网络等】
摘要
当前目标检测方法中的大多数步骤都是可学习的,但区域特征提取步骤仍然主要是手工制作,具有RoI池化方法的特征。此篇工作提出一个泛化观点,整合现存区域特征提取方法和新的方法实现端到端学习。此文章提出的方法消除了大多数启发式选择,并且优于RoI pooling。它进一步向完全可学习的物体检测方向发展。
问题:现存目标检测方法的区域特征提取不是可学习的,是手工制作的
方法:整合现存区域特征提取方法和新的方法实现端到端学习。完全学习的区域特征提取。
两个贡献:
1、提出区域特征提取的泛化观点。每个区域的bin或part的特征可以被公式化为在整个image上的不同位置的image features的加权求和。大多数以前的区域特征提取方法通过以不同方式指定权重(大多数是手工制作)显示为该公式的具体化。
2、基于上述观点,用一个可学习模块从ROI和image features角度表示权重。权重由两个因子影响:ROI和image positions的几何相关性和image features本身。
几何相关性建模用attention model(受启发于《Attention is all you need》NIPS2017,《Relation networks for object detection》cvpr2018,胡瀚)
image features用DCN变形卷积提取
效果:优于RoI pooling
相关工作:可变形RoI poolin引入了从图像内容自适应地学习的逐位偏移(DCN,ICCV2017)
文章细节:
part feature——泛化公式
——ROI或包含更多context part或整个image
p-空间位置
——image feature x(p)在位置p求和的权重。(权重和为1)
——逐元乘积
1、规则的ROI pooling:
=ROI,划分为7*7 bins,y(b)计算用max、average等,Rbk——第k个bin里的所有位置集合。
缺点:由于空间下采样,不能区分非常近的ROI,若两个ROIs距离小于16个像素,它们的ROIs是相同的并且特征也是相同的。
2、Spatial Pyramid Pooling(空间金字塔pooling)(ECCV2014)
Spatial Pyramid Pooling是在不同级别的网格划分上应用常规RoI Pooling
3、Aligned RoI Pooling(Mask RCNN)(ICCV2017)
规则ROI pooling通过下采样和pooling两次向下取整产生很大偏移,区域特征对ROI位置细微变化很敏感,故Aligned RoI Pooling用双线型插值解决规则ROI pooling的量化问题。
4、Deformable RoI pooling(DCN,变形卷积,控制采样点位置,ICCV2017)
通过学习每个bin的偏移量offsets,并将其添加到bin中心来推广Aligned RoI Pooling。
5、earn the weight w k (b, p, x) in Eq. (2) withminimum hand crafting
捕捉几何相关性:公式(8)本质是注意力模型(需要再理解)
第一步,box和image位置嵌入到高维空间中,通过将不同波长的正弦和余弦函数应用于标量z来执行嵌入:
第二步,嵌入向量和权重矩阵线性变换,是可学习的。
第三步,两个变换向量的内积作为几何相关权重。
论文阅读训练(13)相关推荐
- 论文阅读|训练过程中动态改变训练方案的Dynamic R-CNN
目录 论文相关信息 Abstract. 1 Introduction 2 Related Work 3 Dynamic Quality in the Training Procedure 3.1 Pr ...
- 【可解释论文阅读】13.LRP(Layer-wise relevance propagation相关性分数逐层传播)
On Pixel-Wise Explanations for Non-Linear Classifier Decisions by Layer-Wise Relevance Propagation 期 ...
- 论文阅读(13) 水母游泳过程中的神经机械波共振(2021)
水母游泳过程中的神经机械波共振 (2021) 原文链接:https://www.pnas.org/doi/10.1073/pnas.2020025118 今天记录一下,李小龙的武术理念: Empty ...
- [论文阅读] (13)英文论文模型设计(Model Design)如何撰写及精句摘抄——以入侵检测系统(IDS)为例
<娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...
- 对抗训练-smart 论文阅读笔记
对抗训练-smart 论文阅读笔记 SMART: Robust and Efficient Fine-Tuning for Pre-trained NaturalLanguage Models thr ...
- NLP科研训练的小仓鼠的碎碎念1——《Attention-based LSTM for Aspect-level Sentiment Classification》的论文阅读
我记得本科科研训练的组会都是研究生学长学姐汇报工作,然后我们在那边听得懵懵懂懂哈哈哈,尽管如此还是想试着去写一些东西来记录这段有意义的经历 我的导师在一次组会上反复强调汇报的要点是:Problem.M ...
- 论文阅读笔记:为什么深度神经网络的训练无论多少次迭代永远有效?可能类内分布已经坍缩为一个点,模型已经崩溃为线性分类器
论文阅读笔记:Prevalence of neural collapse during the terminalphase of deep learning training,深度学习训练末期普遍的神 ...
- 汉字计算机输入的优越性论文,议论文阅读训练中国第五大发明汉字附答案作文...
初中议论文阅读训练中国第五大发明汉字附答案 ①汉字是当今世界上仍在使用的最古老的文字.从甲骨文算起,已有3500年以土的历 史了.古埃及的圣体字.巴比伦的楔形文字.中美洲的古玛雅文字等相继成为历史的陈 ...
- 多目标跟踪:CVPR2019论文阅读
多目标跟踪:CVPR2019论文阅读 Robust Multi-Modality Multi-Object Tracking 论文链接:https://arxiv.org/abs/1909.03850 ...
最新文章
- layui跳转html如何带参数,Layui跳转页面代码(可携带复杂参数)
- 1.5 Kali Linux策略
- 解决thinkphp在开发环境下文件模块找不到的问题
- nodejs之思维导图(浅理解)
- js获取下月时间_js 获取日期时间段
- 域名系统DNS、文件传送协议FTP、动态主机配置协议DHCP、远程登录协议TELNET、电子邮件协议(SMTP/POP3/IMAP)、常用端口
- 浅析SharedPreferences
- Oracle存储过程异常
- Java构建指定大小文件
- mysql windows下连接linux下的mysql
- c语言编程加三运算,C语言编程入门之--第五章C语言基本运算和表达式-part3
- visio画图常见问题解答
- Python画图源码|玫瑰花|皮卡丘|小猪佩奇|哆啦A梦|大白|小猫
- log4j警告的解决办法-狂奔的蜗牛-iteye技术网站
- [CodeForces - 447D] D - DZY Loves Modification
- ThinkPHP在线小说阅读管理系统
- K.M.P算法个人浅谈
- (幼儿园毕业)Javascript小学级随机生成四则运算
- 华为云服务-申请基础云服务2
- 远程连接docker中的SQL Server