文 | 土豆@知乎

本文已获作者授权,禁止二次转载


前言

在深度学习中,经常会存在需要特征融合的地方[1],而最基本的融合方法无非是:(1) 按点逐位相加(point-wise addition) 和 (2) 进行向量拼接(concatenate)。这两种方式有着异同,也有着关联,接下来进行简单讨论。

Point-wise addition

逐个位相加,用数学表达为: 现有特征向量 , ,为了融合这两个特征向量,直接进行对应元素的相加,既是

进行这个操作的前提当然是这两个向量的维度是相同的,如果是不同维度,则可以通过线性变换 转换成同维向量,其中 。

Concatenate

向量拼接,则是一个更为通用的特征融合方法,数学表达为:现有特征向量, ,将其在同一个阶[2]的进行拼接,有融合特征向量。拼接完后,经常可以用线性映射,转换成,进行这一步的操作目的是能够和前者point-wise addition的进行同维度的比较。

两者关联与异同

前面介绍的两种操作,其实是有联系的,结论先抛出了,就是:point-wise addition 是 concatenate的特殊形式,前者可以用学习的方式,用后者表示出来,用另一种说法就是,point-wise addition 是 concatenate加了一定先验假设的结果。为什么这样说呢?我们先观察一种情况:

比较两种特征融合的方式,并且进行线性映射后的结果,有:

  • Addition:

    其中每一个可以表达成:

    ,用矩阵形式表达就是:

举个具体的例子,, 那么最后结果容易算出是。

  • Concatenate:

    还是用矩阵的形式对其进行表达,不过这个时候我们的,可以发现这个情况下参数量比上者多得多。

这个时候我们可以发现,通过学习过程中的自动参数调整,在concatenate的情况下,总是有办法表达成Addition中的结果的,原因就是可以通过设置Concatenate情形下的的某些值相同,还是举原来的具体例子说明:

,此时只需要,就可以表达成和Addition完全一样的结果,读者可以自行验证。

就结论而言,因为Concatenate情况下参数量完全足以cover住Addition的,因此通过学习过程,完全是可以进行表达的,因此后者是前者的特殊形式,是添加了先验知识的特征融合方法。

那么,这个先验知识是什么呢?笔者认为因为Addition是在相同维度的特征空间中进行的,相加代表特征向量的平移,因此这个先验知识可能是假设这两类特征具有相似性,比如模态比较接近,性质比较相同的特征。当然这个只是笔者猜测,并无文献参考,欢迎各位斧正,谢谢。

有朋友问:

“point-wise addition 是 concatenate的特殊形式”的结果似乎只在均将融合后的特征线性映射成标量后才成立,但是这两种融合方法之后不一定要经过这种处理吧?而且,这种线性映射会减少大量信息,似乎不甚合理?

我觉得这个问题其实是不成立的,因为原文里面举的例子是映射成为标量只是为了举例方便而已,实际上,映射成其他高维矢量也是没问题的,比如说:在Pointwise addition的情况,那么假设其,我们有:

concatenate的情况中,我们有:

那么如果需要退化到addition的情况的话,我们的可以为:

因为我们有八个未知量,而只有两个方程,因此这是个病态问题,其实我们有多组解的,不管怎么样,我们总是可以用concatenate去退化到addition的情况的,不管是映射到标量还是矢量。

后台回复关键词【入群

加入卖萌屋NLP/IR/Rec与求职讨论群

后台回复关键词【顶会

获取ACL、CIKM等各大顶会论文集!

 

[1] Li K, Zou C, Bu S, et al. Multi-modal feature fusion for geographic image annotation[J]. Pattern Recognition, 2018, 73: 1-14.

[2] https://blog.csdn.net/dcrmg/article/details/
79017146

如何融合深度学习特征向量?相关推荐

  1. VisionBank AI实现4项技术突破----传统算法融合深度学习,重新定义“工业视觉检测大脑”

    机器视觉经过长时间的发展,技术不断取得重大突破并被广泛应用,当前已遍布工业生产的各个环节.而且机器视觉易于实现自动化集成,软件集成,是实现智能制造的基础技术.据统计,中国的机器视觉市场需求近几年处于持 ...

  2. Deep Learning for Image and Point Cloud Fusion in Autonomous Driving: A Review(自动驾驶图像点云融合深度学习综述)论文笔记

    原文链接:https://arxiv.org/pdf/2004.05224.pdf II.深度学习的简要回顾 B.点云深度学习 本文将点云深度学习方法分为5类,即基于体素.基于2D视图.基于点.基于图 ...

  3. 用深度学习来解析梦境中出现的物体

    这篇文章主要的工作算是机器学习和神经科学的结合工作,需要读者在这两个方向有一定的基础. 另有科普版本,结构更加清晰,不过删减了很多内容.科普版本如下: 用深度学习来解析梦境中出现的物体 - 行为与认知 ...

  4. 人工智能-深度学习Tensorflow2.0-python

    Windows x86-64 executable installer python-3.8.0-amd64.exe 建议 使用virtualenv实现多个版本Python共存 使用镜像源很简单,用- ...

  5. 机器学习_深度学习毕设题目汇总——交通

    下面是该类的一些题目: 题目 交通标志检测与识别研究 交通路口异常事件检测及识别技术研究 城市道路交通信号区域均衡控制方法及应用研究 城市道路交通网络动态特征分析关键技术研究 基于卷积神经网络的交通密 ...

  6. 【深度学习】有哪些深度学习效果不如传统方法的经典案例?

    作者丨桔了个仔.莫笑傅立叶.LinT 来源丨知乎问答 From丨极市平台 问题链接:https://www.zhihu.com/question/451498156 # 回答一 作者:桔了个仔 来源链 ...

  7. 论文 | 多传感器数据深度图的融合:最近基于深度学习的方法(下)

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 编辑:Sophia 计算机视觉联盟  报道  | 公众号 CVLianMeng 转载于 :黄浴知乎,已获授权 htt ...

  8. 多模态深度学习综述:网络结构设计和模态融合方法汇总

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨小奚每天都要学习@知乎(已授权) 来源丨https://zhuanlan.zhihu.com/p ...

  9. 自动驾驶中图像与点云融合的深度学习研究综述

    Deep Learning for Image and Point Cloud Fusion in Autonomous Driving: A Review IEEE TRANSACTIONS ON ...

最新文章

  1. POJ Mayor's posters——线段树+离散化
  2. Layui框架 中table解决日期格式问题
  3. JavaWeb之Servlet学习-----实现文件动态下载功能 手写servlet 手动构建web程序
  4. python自动抠头像图_Python实现AI自动抠图实例解析
  5. 【Kaggle】Intermediate Machine Learning(缺失值+文字特征处理)
  6. html图书借阅源码,图书借阅管理系统代码图书管理系统源代码
  7. 单片机课程设计音乐盒c语言,单片机课程设计《数字音乐盒的设计》
  8. Tomcat 6.0 安装与启动
  9. SSM框架配置文件加载流程
  10. 华为鸿蒙会适配很老的机型吗,华为鸿蒙适配机型公布 P50首发/小米10S才是真正至尊版...
  11. 蚁群算法求解TSP问题的源代码
  12. 高考数学辅导高考数学复习各个阶段备考指导
  13. CodeForces-B
  14. 动态规划之子序列以及子数组类型的问题
  15. 零时科技 || TempleDAO攻击事件分析
  16. DUL、ODU和AUL介绍
  17. TiDB 可观测性方案落地探索 | “我们这么菜评委不会生气吧”团队访谈
  18. 雨伤php,【星月】伤雨(散文)
  19. linux wget返回值_Linux中curl命令和wget命令的使用介绍与比较
  20. Windows系统下完全隐藏桌面窗口

热门文章

  1. asp.net基础知识
  2. jsp:setProperty
  3. WINCE应用的UI实现方案
  4. boost_1_48_0 在VS2008下的安装 Boost.Asio安装
  5. 重庆大二学生花了6年写出了操作系统
  6. 从未知到2019年的文章汇总
  7. Linux Android 常用shell命令汇总 不断更新
  8. NYOJ276 比较字母大小
  9. get请求可以传body吗_都9102年了,GET和POST的区别掌握了没有?
  10. android转流媒体,android 4.4中的流媒体渲染过程