Deep Learning for Content-Based Image Retrival:A Comprehensive Study 论文笔记

3.1Deep Convolutional Neural Networks

采用的深度学习模型是[1]

为了减少过拟合，使用了两种数据增强的方式：（1）从原始的256×256的图像中通过转变和水平映射（translation and horizontal reflection）提取出随机的224×224的块训练使用（2）为了捕获亮度和颜色的不变性（to capture the invariance in illumination and color），在数据库增加了大量随机的RGB像素值的主成份。通过作者在[1]中可知，这种方式可以减少1%的错误。

在输入层的后面是5个卷积层，第一个卷积层和第二个卷积层之后是一个归一化层（normalization layer）和最大池化层（max pooling layer）。这个网络结构中有几个新颖或者不同的特点使得比之前的卷积网络效果更好。（1）神经元输出函数f是非线性的：Rectified Linear units(ReLUs),和tanh函数相比，可以减少神经网络的训练时间。（2）采用了局部响应归一化（local response normalization）（LRN），这可以对泛化（generalization）有帮助。（3）采用重叠池化（overlapping pooling）的方法。论文中[1]中，作者使用了重叠池化，其他的设置都不变的情况下， top-1和top-5 的错误率分别减少了0.4% 和0.3%。

在卷积层的后面有两个连接4096个神经元的全连接层，记为FC1和FC2，最后是一个输出层，和FC2连接，是一个softmax层来输出1000个分类。

3.2Feature Representation for CBIR

使用CNNs在图像分类上已经有了很多研究，在图像检索的应用还是一个新领域。作者对于深度学习作用于CBIR提出了两个问题：（1）在ImageNet上，如何用训练好的用于分类的CNNs来用于检索（2）在可能缺少训练数据的情况下，如何产生一个通过学习特征来进行CBUR的CNNs模型。

特别地，采用一个训练好的CNNs模型的FC1,FC2,FC3层作为CBIR 的特征表示。其中的FC3是从输出层得到的特征。这种方法对于一个新的数据集的效果不好，下面描述了三种特征表示的方法。

3.2.1Direct Representation

直接用模型的后三层作为特征表示

3.2.2Refining by Similarity Learing

使用了在线相似性学习算法（online similarity learning algorithm）

3.2.3 Refining by Model Retraining

（1）Refining with class label

（2）Refining with side information

[1]Alex Krizhevsky,Ilya Sutskever,Geoffrey E. Hinton.ImageNet Classification with Deep ConvolutionalNeural Networks

Deep Learning for Content-Based Image Retrival:A Comprehensive Study 论文笔记相关推荐

《A Survey on Deep Learning Technique for Video Segmentation》视频分割综述阅读笔记(翻译)
<A Survey on Deep Learning Technique for Video Segmentation>视频分割综述阅读笔记(背景部分翻译) 作者:Wenguan Wang ...
【深度学习（deep learning）】花书第12章应用读书笔记
[深度学习(deep learning)]花书第12章应用读书笔记第12章应用 [深度学习(deep learning)]花书第12章应用读书笔记前言一.大规模深度学习 1.快速的CP ...
《Improved Crowd Counting Method Based onScale-Adaptive Convolutional Neural Network》论文笔记
<Improved Crowd Counting Method Based onScale-Adaptive Convolutional Neural Network>论文笔记论文地址 ...
When Does Machine Learning FAIL? Generalized Transferability for Evasion and Poisoning Attacks论文笔记
When Does Machine Learning FAIL? Generalized Transferability for Evasion and Poisoning Attacks论文笔记该 ...
Deep Clustering via Joint Convolutional Autoencoder Embedding and RelativeEntropy Minimization论文笔记
Deep Clustering via Joint Convolutional Autoencoder Embedding and RelativeEntropy Minimization 论文链接 ...
Deep Learning for Polar Codes over Flat Fading Channels《阅读笔记》精读
平面衰落通道上的极地代码深度学习文章目录 Abstract introduction 二.系统模型 1.系统模型框图 Polar Codes 神经网络模型性能评估结论 Abstract 提出了啥 ...
ICCV 2017 DSiam:《Learning Dynamic Siamese Network for Visual Object Tracking》论文笔记
理解出错之处望不吝指正. 本文模型叫做DSiam.作者提出一个Dynamic Siamese Network,可以使用一个transformation learning model来在线学习目标的外观 ...
CVPR 2018 STRCF:《Learning Spatial-Temporal Regularized Correlation Filters for Visual Tracking》论文笔记
理解出错之处望不吝指正. 本文提出的模型叫做STRCF. 在DCF中存在边界效应,SRDCF在DCF的基础上中通过加入spatial惩罚项解决了边界效应,但是SRDCF在tracking的过程中要使用 ...
CVPR 2018 RASNet:《Learning Attentions: Residual Attentional Siamese Network for Tracking》论文笔记
理解出错之处望不吝指正. 本文模型叫做RASNet,在Siamese框架下重构了CF,提出了三种attention机制(general.residual.channel),这三种attention的提 ...
Learning to see in the dark【SID】论文笔记
整理下最近一篇论文的学习笔记.这是由UIUC的陈晨和Intel Labs的陈启峰.许佳.Vladlen Koltun 合作提出的一种在黑暗中也能快速.清晰的成像系统,让机器"看破" ...

Deep Learning for Content-Based Image Retrival:A Comprehensive Study 论文笔记

Deep Learning for Content-Based Image Retrival:A Comprehensive Study 论文笔记相关推荐

最新文章

热门文章