Robust Deep Multi-modal Learning Based on Gated Information Fusion Network

2018-07-27 14:25:26

Paper:https://arxiv.org/pdf/1807.06233.pdf 

Related Papers:  

1. Infrared and visible image fusion methods and applications: A survey   Paper

2. Chenglong Li, Xiao Wang, Lei Zhang, Jin Tang, Hejun Wu, and Liang Lin. WELD: Weighted Low-rank Decomposition  or Robust Grayscale-Thermal Foreground Detection. IEEE Transactions on Circuits and Systems for Video Technology (T-CSVT), 27(4): 725-738, 2017. [Project page with Dataset and Code]

3. Chenglong Li, Xinyan Liang, Yijuan Lu, Nan Zhao, and Jin Tang. RGB-T Object Tracking: Benchmark and Baseline.[arXiv] [Dataset: Google drive, Baidu cloud] [Project page]

本文针对多模态融合问题(Multi-modal),提出一种基于 gate 机制的融合策略,能够自适应的进行多模态信息的融合。作者将该方法用到了物体检测上,其大致流程图如下所示:

如上图所示,作者分别用两路 Network 来提取两个模态的特征。该网络是由标准的 VGG-16 和 8 extra convolutional layers 构成。另外,作者提出新的 GIF(Gated Information Fusion Network) 网络进行多个模态之间信息的融合,以取得更好的结果。动机当然就是多个模态的信息,是互补的,但是有的信息帮助会更大,有的可能就质量比较差,功效比较小,于是就可以自适应的来融合,达到更好的效果。

Gated Information Fusion Network (GIF)

如上图所示:

该 GIF 网络的输入是:已经提取的 CNN feature map,这里是 F1, F2. 然后,将这两个 feature 进行 concatenate,得到 $F_G$. 该网络包含两个部分:

1. information fusion network(图2,虚线框意外的部分);

2. weight generation network (WG Network,即:图2,虚线处);

Weight Generation Network 分别用两个 3*3*1 的卷积核对组合后的 feature map $F_G$ 进行操作,然后输入到 sigmoid 函数中,即:gate layer,然后输出对应的权重 $w_1$,$w_2$。

Information fusion network 分别用得到的两个权重,点乘原始的 feature map,得到加权以后的特征图,将两者进行 concatenate 后,用 1*1*2k 的卷积核,得到最终的 feature map。

总结整个过程,可以归纳为:

== Done !

Paper Read: Robust Deep Multi-modal Learning Based on Gated Information Fusion Network相关推荐

  1. Turbo Autoencoder: Deep learning based channel code for point-to-point communication channels

    Turbo Autoencoder: Deep learning based channel code for point-to-point communication channels Abstra ...

  2. Deep learning based multi-scale channel compression feature surface defect detection system

    基于深度学习的多尺度通道压缩特征表面缺陷检测系统 Deep learning based multi-scale channel compression feature surface defect ...

  3. 跌倒综述 Deep Learning Based Systems Developed for Fall Detection A Review

    文章目录 1.基本信息 2. 第一节 介绍 3. 第二节 跌倒检测系统文献 4.第三节 讨论和未来方向 5. 第四节 结论 6. 参考文献 1.基本信息 题目:Deep Learning Based ...

  4. 【RS-Attack】Data Poisoning Attacks to Deep Learning Based Recommender Systems NDSS‘21

    Data Poisoning Attacks to Deep Learning Based Recommender Systems NDSS'21 首个在基于深度学习的推荐系统中进行投毒攻击的研究.文 ...

  5. Deep Learning Based Registration文章阅读(五)《Anatomy-guided Multimodal Registration by Learning Segment 》

    Deep Learning Based Registration文章阅读(五) 这篇文章是MIA2021新出的一篇文章<Anatomy-guided Multimodal Registratio ...

  6. 基于深度强化学习的车道线检测和定位(Deep reinforcement learning based lane detection and localization) 论文解读+代码复现

    之前读过这篇论文,导师说要复现,这里记录一下.废话不多说,再重读一下论文. 注:非一字一句翻译.个人理解,一定偏颇. 基于深度强化学习的车道检测和定位 官方源码下载:https://github.co ...

  7. 论文详读:LEMNA: Explaining Deep Learning based Security Applications

    我以我ppt的内容顺序介绍一下这篇论文,希望有错误的地方大家可以帮我指出嘻嘻 1.论文出处 论文名:LEMNA: Explaining Deep Learning based Security App ...

  8. 论文翻译七:Adversarial Transfer Learning for Deep Learning Based Automatic Modulation Classification

    30天挑战翻译100篇论文 坚持不懈,努力改变,在翻译中学习,在学习中改变,在改变中成长- Adversarial Transfer Learning for Deep Learning Based ...

  9. 论文翻译:2021_语音增强模型压缩_Towards model compression for deep learning based speech enhancement...

    论文地址:面向基于深度学习的语音增强模型压缩 论文代码:没开源,鼓励大家去向作者要呀,作者是中国人,在语音增强领域 深耕多年 引用格式:Tan K, Wang D L. Towards model c ...

  10. 【文献阅读03】Deep Reinforcement Learning Based Resource Allocation for V2V Communications

    Deep Reinforcement Learning Based Resource Allocation for V2V Communications(点击可见原文) p.s.此文19年发表,到20 ...

最新文章

  1. Docker + Intellij IDEA,提升 10 倍生产力!
  2. 牛客网 二叉树的层序遍历
  3. c++清空一个txt文本_Linux下常用文本处理命令大全
  4. ASP.NET弹出对话框并跳转页面
  5. html中css修改字体,CSS字体设置 DIV内字体设置
  6. 和 远程文件夹同步_云同步实操(2)安卓端同步文件夹2
  7. 姚期智院士亲自讲授,一文读懂量子计算
  8. linux命令ps aux|grep xxx
  9. python画柱状图-Python 使用 matplotlib 画柱状图教程
  10. 战地一的服务器在哪个文件夹,战地1怎么加入服务器 战地1加入服务器方法
  11. Ubuntu环境下NFS服务器搭建
  12. 深入浅出 MFC_华中理 工_简体版电子书pdf下载
  13. Linux下socket编程的简单实例
  14. 存储结构的定义及其分类
  15. Android Camera HAL3 - MultiCamera-HALBufferManager
  16. python re sub 替换多个_re.sub 实现多处替换
  17. Layui table内写done回调事件
  18. ubuntu 保存视频流的关键
  19. WebService(1) 调用第三方服务
  20. 打开bat文件闪退以及‘java‘不是内部或外部命令,也不是可运行的程序或批处理文件【本人亲测解决方法】

热门文章

  1. 重庆市计算机一级考试2015,2015年计算机一级考试试题及答案
  2. matlab中cell2mat的作用,Matlab中cell2mat的使用
  3. glob.glob()、sort() 等一些函数的用法
  4. 使用文件进行输入输出的两种方式(算法竞赛入门经典第2章)
  5. python鼠标选中文本内容_【求助】使用Python脚本如何获取Windows中选中的文本
  6. java 编写a-z输出,有1-26个数字和a-z字母,用Java多线程实现先输出2和数字再输出2个字...
  7. java 排队实现_java中的优先列队-PriorityQueue源码实现解析
  8. 航天有关的计算机知识,这些关于神舟十二上的电脑硬核小知识,你知道吗?
  9. python颜色参数_python matplotlib:plt.scatter() 大小和颜色参数详解
  10. 'gbk' codec can't encode character解决方法