论文杂记
上一篇 主目录 下一篇

文章结构

  • 1 知识基础
    • 1.1 卷积神经网络
    • 1.2 灰度共生矩阵
    • 1.3 LBP 特征
    • 1.4 特征融合
    • 1.5 典型相关分析算法(CCA)
    • 1.6 Faster-RCNN
  • 2 本文工作
    • 2.1 算法整体流程
    • 2.2 颜色直方图和纹理特征
    • 2.3 特征融合

前言
出自电子工程设计2019.7期,中国石油大学(华东)计算机与通信工程学院,山东 青岛 266580
要点概述:

  1. 基于 FCCA 的多特征融合的检索方法
  2. 通过卷积神经网络获取图像位置和类别,提取颜色和纹理特征,通过典型相关分析方法将两个特征进行融合然后作为检索的依据,用欧氏距离进行匹配。

关键词:Faster-RCNN;典型相关分析;多特征融合;分类、检索


1 知识基础

1.1 卷积神经网络

CNN的工作原理

1.2 灰度共生矩阵

灰度直方图是对图像上单个像素具有某个灰度进行统计的结果,而灰度共生矩阵是对图像上保持某距离的两像素分别具有某灰度的状况进行统计得到的。
取图像(N×N)中任意一点 (x,y)及偏离它的另一点 (x+a,y+b),设该点对的灰度值为 (g1,g2)。令点(x,y) 在整个画面上移动,则会得到各种 (g1,g2)值,设灰度值的级数为 k,则(g1,g2) 的组合共有 k 的平方种。对于整个画面,统计出每一种 (g1,g2)值出现的次数,然后排列成一个方阵,再用(g1,g2) 出现的总次数将它们归一化为出现的概率P(g1,g2) ,这样的方阵称为灰度共生矩阵。距离差分值(a,b) 取不同的数值组合,可以得到不同情况下的联合概率矩阵。(a,b) 取值要根据纹理周期分布的特性来选择,对于较细的纹理,选取(1,0)、(1,1)、(2,0)等小的差分值。

  • 当 a=1,b=0时,像素对是水平的,即0度扫描;
  • 当a=0,b=1 时,像素对是垂直的,即90度扫描;
  • 当 a=1,b=1时,像素对是右对角线的,即45度扫描;
  • 当 a=-1,b=1时,像素对是左对角线,即135度扫描。

这样,两个象素灰度级同时发生的概率,就将 (x,y)的空间坐标转化为“灰度对” (g1,g2)的描述,形成了灰度共生矩阵。
实验中对灰度共生矩阵进行了如下的归一化:

更多内容: 灰度共生矩阵(百度百科)

1.3 LBP 特征

见《增强旋转不变LBP算法及其在图像检索中的应用》 1.1节

1.4 特征融合

特征融合包括直接将特征进行融合进行检索和在检索之后通过融合不同特征的检索结果进行检索。前者特征融合的方法有以下几种:串联融合法[5]、并行融合法[6]和典型相关分析(CCA)。利用基于图的多特征融合方法提高图像检索效果,适用于大规模图像检索,对小型数据库存在局限性。
推荐阅读:深度特征融合—高低层特征融合

1.5 典型相关分析算法(CCA)

CCA(Canonical Correlation Analysis),目的是研究多个随机向量的相关性。该算法广泛用于模式识别。其基本思想找到一个基向量,使得空间内的两个随机变量在基向量上的投影相关性最大。根据 3.3 章节求出上文中提到的基向量,将不同的特征向量分别和基向量相乘,通过计算作图像融合后的特征向量。但是直接使用CCA 方法存在以下问题:其一忽略类别之间的差异,使用该方法的主要目的是区别不同的特征,但在本文的图像检索中需要将相同类进行归类以提高检索速度。其二在提取特征时将其他冗余信息也作为特征的一部分,使得提取的特征不够准确。为解决以上两个问题,引入 Faster-RCNN 网络获取图像主体信息的位置和类别。

典型相关分析 (推荐阅读)
典型相关分析(百度百科)

1.6 Faster-RCNN

Faster-RCNN 作为目前精度较高的目标检测网络模型,在 Fast-RCNN 网络上进行改进,将区域建议网络与之融合,大大缩短了计算时间,使检测和定位的速度接近实时。本文使用该网络模型获取图像中主要信息的位置和类别,目的是提高行李图像的检索。目前常见的网络结构包括 VGG16[15]网络和 ZF[16]网络。经实验结果表示,在小数据集上,两个网络模型在定位和分类的效果相似,ZF 网络训练过程短,在进行图像检索时耗时更短,因此本文选取 ZF 网络模型训练机场行李图像。Faster-RCNN 的模型主要分为两大模块,RPN 模块负责区别是否为背景,检测模块负责将卷积层和RPN 输出的特征送入全连接层进行分类。

faster-rcnn原理讲解(推荐阅读)
FasterRCNN原理
Faster R-CNN文章详细解读

2 本文工作

2.1 算法整体流程

对图像数据库中每张图像添加标签,使用 Faster-RCNN 网络模型训练数据库,获得图像中感兴趣区域和图像类别。将得到的区域提取颜色和 LBP特征,然后使用 CCA 方法计算,使不同特征经过转换后相关性最大。计算后,将特征(应该是相关性大的特征)融合并合并,最后将欧氏距离用于图像检索。
流程图:

2.2 颜色直方图和纹理特征

颜色直方图
这里的颜色用到了HSV的表示方法,更多吧关于HSV信息参阅:
https://baike.baidu.com/item/HSV/547122?fr=aladdin
颜色直方图方法是计算颜色空间 3个通道 H、S、V 的通道的像素值,然后根据数值统计形成直方图。直方图可用于简单描述图像中颜色的全局分布,即整个图像中不同颜色的比例。颜色直方图可以用一个一维的离散函数表示为:

  • 其中 k 代表图像的特征值,L 代表图像的特征可取的值个数,nk是整幅图像中特征值为 k的象素的个数,N 代表图像中像素的总数。

本文分别在 HSV 3个通道上以强度值范围 0~255 进行统计,之后统计这 3 个通道上的直方图,每个通道基于颜色出现的频率对 40 维特征向量进行计数(应该是在0~255中选取出现概率最大的前40个概率值作为40维特征向量),然后将总共 120 个维度中的 3个通道的特征向量联系起来。

纹理特征
更多关于LBP参阅我的另一篇:《增强旋转不变LBP算法及其在图像检索中的应用》 中1.1节

2.3 特征融合

LBP 特征具有灰度不变性和旋转不变性,其对光照几乎没有影响,LBP是能反应纹理特征的,但有时不反映对象表面的纹理特征。为此,如果能实现多特征的融合,就能获得更为理想的检索结果。因此本文采用局部和整体融合的方案,分别计算颜色特征和纹理特征,分析原有独立特征向量之间的相关性将两者结合在一起构成一个新的特征向量,作为图像新的特征进行检索。下面是特征融合的过程:
设颜色直方图特征和 LBP 特征分别为 X 和 Y,其维度为 P1、P2

1)求 X 和 Y 的协方差矩阵 Cxx、Cyy、Cxy、Cyx,得到 X和 Y的相关阵

2)计算矩阵 A和 B;

3)求 A、B 矩 阵 的 特 征 值 λi ^2(i = 1,2,3,…r) 且 r=min(P1,P2))和对应的标准正交特征向量 μi 和 νi ;
4)设典型投影向量


求得 δxi ,δyi(i = 1,2,3…,r) ,取前 K 对向量组成典型投影矩阵 Wx和 Wy;根据线性变换关系得到融合特征。

数学是硬伤

论文杂记:传送门

基于 FCCA 的多特征融合的检索方法相关推荐

  1. Automatic Modulation Classification UsingConvolutional Neural Network 解读(基于SPWVD和BJD特征融合的卷积神经网络调制自动)

    摘要:自动调制分类(AMC)在频谱监测和认知无线电中越来越重要.然而,现有的调制分类算法大多忽略了不同特征之间的互补性和特征融合的重要性.为了弥补这些缺陷,该文提出了一种基于卷积神经网络(CNN)的A ...

  2. PLSL-SLAM:基于视觉点线特征融合SLAM(毕设开源,参考VINS-Fusion、PL-VIO、VLOAM)

    概要:双目点线特征VIO+激光雷达点云深度增强视觉特征 视频:B站 Bag包:链接:https://pan.baidu.com/s/1esy94hAgzWKazTELXuCtsQ 提取码:mj8k 外 ...

  3. 【深度学习】特征融合的重要方法 | 张量的拼接 | torch.cat()函数 | torch.add(函数

    文章目录 前言 一.torch.cat()函数 拼接只存在h,w(高,宽)的图像 二.torch.cat() 拼接存在c,h,w(通道,高,宽)的图像 三.torch.add()使张量对应元素直接相加 ...

  4. ACL 2020 | 多跳问答的基于对齐的无监督迭代解释检索方法

    ©PaperWeekly 原创 · 作者|舒意恒 学校|南京大学硕士生 研究方向|知识图谱 论文标题:Unsupervised Alignment-based Iterative Evidence R ...

  5. 自适应空间特征融合( adaptively spatial feature fusion)一种基于数据驱动的金字塔特征融合策略

    代码地址:GitHub - GOATmessi7/ASFF: yolov3 with mobilenet v2 and ASFFhttps://github.com/GOATmessi7/ASFF 论 ...

  6. 基于HOG-LBP特征融合的头肩检测研究

    from: http://www.hqew.com/tech/fangan/1721922.html 摘  要: 提出了一种基于HOG-LBP特征融合的人体头肩检测方法,其要点是将人体头肩图像等分为多 ...

  7. IEEE2019论文:使用基于特征融合和缩放的具有空间上下文分析的单镜头检测器在无人机图像中检测小物体

    摘要: 无人机(UAV)图像中的目标由于拍摄高度较高通常都很小,我们虽然在目标检测方面已经做了很多工作,但是如何准确.快速地检测出小目标仍然是一个有待解决的挑战.本文针对无人机图像中的小目标检测问题, ...

  8. 论文翻译:《6mAPred-MSFF:基于多尺度特征融合机制预测跨物种DNA N6-甲基腺嘌呤位点的深度学习模型》

    Title:6mAPred-MSFF: A Deep Learning Model for Predicting DNA N6-Methyladenine Sites across Species B ...

  9. 层与特征融合_【计算机系统应用】(第122期)感受野特征增强的 SSD 目标检测算法...

    点击上方"蓝字",关注我们吧! 目标检测是计算机视觉领域的一项重要任务, 是 生活中如实例分割[1] , 面部分析[2] , 汽车自动驾驶[3].视 频分析[4] 等各种视觉应用的 ...

最新文章

  1. Java 位图法排序
  2. mysql root密码重置
  3. Go语言与数据库开发:01-09
  4. Spring集成–从头开始应用程序,第1部分
  5. python转为字节_将字节转换为python中的位
  6. 面试问题背后的“猫腻”
  7. pythonrequests库使用方法_python三方库之requests-快速上手
  8. 完全背包问题python_令人头疼的背包九讲(2)完全背包问题
  9. java 同步块关键字_Java同步关键字,同步方法和块
  10. 配置Mac自带的Apache http服务器
  11. VRRP在城域网中的应用
  12. 立下flag,一周一篇博客
  13. rust维京船_rust如何开小地图 | 手游网游页游攻略大全
  14. ubuntu 强制退出_强制在Ubuntu中退出无响应的图形应用程序
  15. 脚本语言【JavaScript基础】JavaScript函数:声明+调用
  16. JavaEE——作业管理系统期末总结
  17. jsp页面获取到后台的cookie(记住我)
  18. 在哪里下载Linux
  19. Mysql| order by 排序检索数据(ASC,DESC)
  20. window证书管理

热门文章

  1. 学好C/C++编程,走遍天下都不怕
  2. JS基础-一个完美的递归函数
  3. Self和self的区别
  4. video-play使用,vue2
  5. Verilog 语法入门知识
  6. 解答:为什么要搭建企业论坛?如何快速搭建?
  7. SSM框架报错分析(一)——There is no getter for property named 'XXX' in 'class java.lang.String'...
  8. 音乐剧推荐-<<爱在思念的两端>>
  9. HTK 安装、编译以及测试——Ubuntu 14.04
  10. MSYS 1.0.11 + MinGW安装方法