《Pixel-Adaptive Convolutional Neural Networks》(2019)

作者:UMass Amherst  NVIDIA

摘要

卷积是CNN的基础组成block,被广泛使用的主要原因是它们的权重是空间共享的,也是最主要的限制,是使得卷积是内容无关的。此篇文章提出一个像素自适应的卷积操作,简称(PAC),对标准卷积的简单有效修改,其中滤波器权重乘以空间变化的内核,变化内核取决于可学习的、局部像素特征。PAC是几个有名的滤波技术的泛化,因此可以广范使用。具体的,证明当PAC用于deep joint image upsampling(深联合图像上采样)性能最好。PAC也可以对全连接CRF提供迭代,称为PAC-CRF,比Full-CRF更快。除此之外,PAC可用作预训练网络中卷积层的直接替代,从而实现一致的性能改进。

问题:处理卷积由于空间共享使得内容无关的限制。

方法:提出像素自适应卷积操作(PCA),对标准卷积的简单有效修改,其中滤波器权重乘以空间变化的内核,变化内核取决于可学习的、局部像素特征。

自适应核K用预训练或学习的特征构建,输入V,操作:逐像素相乘求和。

效果:PAC是滤波器的泛化,可将预训练网络中的卷积层直接替换。

《Learning Region Features for Object Detection》(ECCV2018)

作者:Han Hu胡瀚(MSRA)【研究变形卷积、关系网络等】

摘要

当前目标检测方法中的大多数步骤都是可学习的,但区域特征提取步骤仍然主要是手工制作,具有RoI池化方法的特征。此篇工作提出一个泛化观点,整合现存区域特征提取方法和新的方法实现端到端学习。此文章提出的方法消除了大多数启发式选择,并且优于RoI pooling。它进一步向完全可学习的物体检测方向发展。

问题:现存目标检测方法的区域特征提取不是可学习的,是手工制作的

方法:整合现存区域特征提取方法和新的方法实现端到端学习。完全学习的区域特征提取。

两个贡献:

1、提出区域特征提取的泛化观点。每个区域的bin或part的特征可以被公式化为在整个image上的不同位置的image features的加权求和。大多数以前的区域特征提取方法通过以不同方式指定权重(大多数是手工制作)显示为该公式的具体化。

2、基于上述观点,用一个可学习模块从ROI和image features角度表示权重。权重由两个因子影响:ROI和image positions的几何相关性和image features本身。

几何相关性建模用attention model(受启发于《Attention is all you need》NIPS2017,《Relation networks for object detection》cvpr2018,胡瀚)

image features用DCN变形卷积提取

效果:优于RoI pooling

相关工作:可变形RoI poolin引入了从图像内容自适应地学习的逐位偏移(DCN,ICCV2017)

文章细节:

part feature——泛化公式

——ROI或包含更多context part或整个image

p-空间位置

——image feature x(p)在位置p求和的权重。(权重和为1)

——逐元乘积

1、规则的ROI pooling:

=ROI,划分为7*7 bins,y(b)计算用max、average等,Rbk——第k个bin里的所有位置集合。

缺点:由于空间下采样,不能区分非常近的ROI,若两个ROIs距离小于16个像素,它们的ROIs是相同的并且特征也是相同的。

2、Spatial Pyramid Pooling(空间金字塔pooling)(ECCV2014)

Spatial Pyramid Pooling是在不同级别的网格划分上应用常规RoI Pooling

3、Aligned RoI Pooling(Mask RCNN)(ICCV2017)

规则ROI pooling通过下采样和pooling两次向下取整产生很大偏移,区域特征对ROI位置细微变化很敏感,故Aligned RoI Pooling用双线型插值解决规则ROI pooling的量化问题。

4、Deformable RoI pooling(DCN,变形卷积,控制采样点位置,ICCV2017)

通过学习每个bin的偏移量offsets,并将其添加到bin中心来推广Aligned RoI Pooling。

5、earn the weight w k (b, p, x) in Eq. (2) withminimum hand crafting

捕捉几何相关性:公式(8)本质是注意力模型(需要再理解)

第一步,box和image位置嵌入到高维空间中,通过将不同波长的正弦和余弦函数应用于标量z来执行嵌入:

第二步,嵌入向量权重矩阵线性变换,是可学习的。

第三步,两个变换向量的内积作为几何相关权重。

论文阅读训练(13)相关推荐

  1. 论文阅读|训练过程中动态改变训练方案的Dynamic R-CNN

    目录 论文相关信息 Abstract. 1 Introduction 2 Related Work 3 Dynamic Quality in the Training Procedure 3.1 Pr ...

  2. 【可解释论文阅读】13.LRP(Layer-wise relevance propagation相关性分数逐层传播)

    On Pixel-Wise Explanations for Non-Linear Classifier Decisions by Layer-Wise Relevance Propagation 期 ...

  3. 论文阅读(13) 水母游泳过程中的神经机械波共振(2021)

    水母游泳过程中的神经机械波共振 (2021) 原文链接:https://www.pnas.org/doi/10.1073/pnas.2020025118 今天记录一下,李小龙的武术理念: Empty ...

  4. [论文阅读] (13)英文论文模型设计(Model Design)如何撰写及精句摘抄——以入侵检测系统(IDS)为例

    <娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...

  5. 对抗训练-smart 论文阅读笔记

    对抗训练-smart 论文阅读笔记 SMART: Robust and Efficient Fine-Tuning for Pre-trained NaturalLanguage Models thr ...

  6. NLP科研训练的小仓鼠的碎碎念1——《Attention-based LSTM for Aspect-level Sentiment Classification》的论文阅读

    我记得本科科研训练的组会都是研究生学长学姐汇报工作,然后我们在那边听得懵懵懂懂哈哈哈,尽管如此还是想试着去写一些东西来记录这段有意义的经历 我的导师在一次组会上反复强调汇报的要点是:Problem.M ...

  7. 论文阅读笔记:为什么深度神经网络的训练无论多少次迭代永远有效?可能类内分布已经坍缩为一个点,模型已经崩溃为线性分类器

    论文阅读笔记:Prevalence of neural collapse during the terminalphase of deep learning training,深度学习训练末期普遍的神 ...

  8. 汉字计算机输入的优越性论文,议论文阅读训练中国第五大发明汉字附答案作文...

    初中议论文阅读训练中国第五大发明汉字附答案 ①汉字是当今世界上仍在使用的最古老的文字.从甲骨文算起,已有3500年以土的历 史了.古埃及的圣体字.巴比伦的楔形文字.中美洲的古玛雅文字等相继成为历史的陈 ...

  9. 多目标跟踪:CVPR2019论文阅读

    多目标跟踪:CVPR2019论文阅读 Robust Multi-Modality Multi-Object Tracking 论文链接:https://arxiv.org/abs/1909.03850 ...

最新文章

  1. layui跳转html如何带参数,Layui跳转页面代码(可携带复杂参数)
  2. 1.5 Kali Linux策略
  3. 解决thinkphp在开发环境下文件模块找不到的问题
  4. nodejs之思维导图(浅理解)
  5. js获取下月时间_js 获取日期时间段
  6. 域名系统DNS、文件传送协议FTP、动态主机配置协议DHCP、远程登录协议TELNET、电子邮件协议(SMTP/POP3/IMAP)、常用端口
  7. 浅析SharedPreferences
  8. Oracle存储过程异常
  9. Java构建指定大小文件
  10. mysql windows下连接linux下的mysql
  11. c语言编程加三运算,C语言编程入门之--第五章C语言基本运算和表达式-part3
  12. visio画图常见问题解答
  13. Python画图源码|玫瑰花|皮卡丘|小猪佩奇|哆啦A梦|大白|小猫
  14. log4j警告的解决办法-狂奔的蜗牛-iteye技术网站
  15. [CodeForces - 447D] D - DZY Loves Modification
  16. ThinkPHP在线小说阅读管理系统
  17. K.M.P算法个人浅谈
  18. (幼儿园毕业)Javascript小学级随机生成四则运算
  19. 华为云服务-申请基础云服务2
  20. 远程连接docker中的SQL Server

热门文章

  1. 【FPGA】SPI协议
  2. 建设数据中心机房主要看这几点,否则被定为劣质机房!!!
  3. 工作流(Flowable)
  4. 【 已解决 】iPhone 越狱后用爱思助手刷机出现 NORdata,无法刷机
  5. layui totalRow 多层嵌套json_鹏华资产40亿产品兑付追踪:中招嵌套结构 或踩雷非标-基金频道...
  6. 将大写字母转化为小写字母
  7. 调用批处理bat文件
  8. 17级智能信息处理与控制团支部大会
  9. AsyncTask介绍
  10. Web24——Ajax