Deep Learning for Content-Based Image Retrival:A Comprehensive Study 论文笔记
版权声明:本文为博主原创文章,未经博主允许不得转载。
3.1Deep Convolutional Neural Networks
采用的深度学习模型是[1]
为了减少过拟合,使用了两种数据增强的方式:(1)从原始的256×256的图像中通过转变和水平映射(translation and horizontal reflection)提取出随机的224×224的块训练使用(2)为了捕获亮度和颜色的不变性(to capture the invariance in illumination and color),在数据库增加了大量随机的RGB像素值的主成份。通过作者在[1]中可知,这种方式可以减少1%的错误。
在输入层的后面是5个卷积层,第一个卷积层和第二个卷积层之后是一个归一化层(normalization layer)和最大池化层(max pooling layer)。这个网络结构中有几个新颖或者不同的特点使得比之前的卷积网络效果更好。(1)神经元输出函数f是非线性的:Rectified Linear units(ReLUs),和tanh函数相比,可以减少神经网络的训练时间。(2)采用了局部响应归一化(local response normalization)(LRN),这可以对泛化(generalization)有帮助。(3)采用重叠池化(overlapping pooling)的方法。论文中[1]中,作者使用了重叠池化,其他的设置都不变的情况下, top-1和top-5 的错误率分别减少了0.4% 和0.3%。
在卷积层的后面有两个连接4096个神经元的全连接层,记为FC1和FC2,最后是一个输出层,和FC2连接,是一个softmax层来输出1000个分类。
3.2Feature Representation for CBIR
使用CNNs在图像分类上已经有了很多研究,在图像检索的应用还是一个新领域。作者对于深度学习作用于CBIR提出了两个问题:(1)在ImageNet上,如何用训练好的用于分类的CNNs来用于检索(2)在可能缺少训练数据的情况下,如何产生一个通过学习特征来进行CBUR的CNNs模型。
特别地,采用一个训练好的CNNs模型的FC1,FC2,FC3层作为CBIR 的特征表示。其中的FC3是从输出层得到的特征。这种方法对于一个新的数据集的效果不好,下面描述了三种特征表示的方法。
3.2.1Direct Representation
直接用模型的后三层作为特征表示
3.2.2Refining by Similarity Learing
使用了在线相似性学习算法(online similarity learning algorithm)
3.2.3 Refining by Model Retraining
(1)Refining with class label
(2)Refining with side information
[1]Alex Krizhevsky,Ilya Sutskever,Geoffrey E. Hinton.ImageNet Classification with Deep ConvolutionalNeural Networks
Deep Learning for Content-Based Image Retrival:A Comprehensive Study 论文笔记相关推荐
- 《A Survey on Deep Learning Technique for Video Segmentation》视频分割综述阅读笔记(翻译)
<A Survey on Deep Learning Technique for Video Segmentation>视频分割综述阅读笔记(背景部分翻译) 作者:Wenguan Wang ...
- 【深度学习(deep learning)】花书第12章 应用 读书笔记
[深度学习(deep learning)]花书第12章 应用 读书笔记 第12章 应用 [深度学习(deep learning)]花书第12章 应用 读书笔记 前言 一.大规模深度学习 1.快速的CP ...
- 《Improved Crowd Counting Method Based onScale-Adaptive Convolutional Neural Network》论文笔记
<Improved Crowd Counting Method Based onScale-Adaptive Convolutional Neural Network>论文笔记 论文地址 ...
- When Does Machine Learning FAIL? Generalized Transferability for Evasion and Poisoning Attacks论文笔记
When Does Machine Learning FAIL? Generalized Transferability for Evasion and Poisoning Attacks论文笔记 该 ...
- Deep Clustering via Joint Convolutional Autoencoder Embedding and RelativeEntropy Minimization论文笔记
Deep Clustering via Joint Convolutional Autoencoder Embedding and RelativeEntropy Minimization 论文链接 ...
- Deep Learning for Polar Codes over Flat Fading Channels《阅读笔记》精读
平面衰落通道上的极地代码深度学习 文章目录 Abstract introduction 二.系统模型 1.系统模型框图 Polar Codes 神经网络模型 性能评估 结论 Abstract 提出了啥 ...
- ICCV 2017 DSiam:《Learning Dynamic Siamese Network for Visual Object Tracking》论文笔记
理解出错之处望不吝指正. 本文模型叫做DSiam.作者提出一个Dynamic Siamese Network,可以使用一个transformation learning model来在线学习目标的外观 ...
- CVPR 2018 STRCF:《Learning Spatial-Temporal Regularized Correlation Filters for Visual Tracking》论文笔记
理解出错之处望不吝指正. 本文提出的模型叫做STRCF. 在DCF中存在边界效应,SRDCF在DCF的基础上中通过加入spatial惩罚项解决了边界效应,但是SRDCF在tracking的过程中要使用 ...
- CVPR 2018 RASNet:《Learning Attentions: Residual Attentional Siamese Network for Tracking》论文笔记
理解出错之处望不吝指正. 本文模型叫做RASNet,在Siamese框架下重构了CF,提出了三种attention机制(general.residual.channel),这三种attention的提 ...
- Learning to see in the dark【SID】论文笔记
整理下最近一篇论文的学习笔记.这是由UIUC的陈晨和Intel Labs的陈启峰.许佳.Vladlen Koltun 合作提出的一种在黑暗中也能快速.清晰的成像系统,让机器"看破" ...
最新文章
- Vue监听器与监听滥用
- SAP HR 常用事务代码
- python分块处理功能_python 对列表分块
- 卷积神经网络VGG16权重数量的计算和理解(转载)
- docker always_Ubuntu+Docker+STF环境搭建
- .NET Core微服务之服务间的调用方式(REST and RPC)
- 使用JAX-RS的HTTP缓存
- 远端仓库初始化成裸仓库 git init --bare
- 指标赋权与评价类方法总结
- java 资源描述文件_j2me新手必看-Java应用描述文件(JAD)编辑器
- Ubuntu安装Spark
- 用数据全方位解读《欢乐颂2》
- [PAT] PAT注意点
- 【狂神说:秦疆】SpringMVC笔记
- 手板(prototype)
- 专有钉钉下载(windows、IOS、Android)地址
- Lattice Diamond关于原语的使用
- “游目骋怀—孙文佳书法展”近日在中国美术馆开幕
- 苹果手机iOS用fiddler抓不了https的包
- 2022-08-21 星环科技-C++开发笔试