python 图像检索_深度学习图像检索
实现图像检索系统大概的步骤,需要用到哪方面的知识?
我对图像检索比较感兴趣,想将毕业设计定为这个,可是不知道怎么入手,大家觉得怎么做比较好呢,大概的步骤,需要用到哪方面的知识?
.zm-item-answer"}" data-init="{"params":
{"url_token": 25833727, "pagesize": 20, "offset": 0}, "nodename":
"QuestionAnswerListV2"}" style="border-bottom-width: 1px;
border-bottom-style: solid; border-bottom-color: rgb(238, 238,
238);">
赞同2反对,不会显示你的姓名
CBIR系统的构建主要包括:
1)定义图像描述符(图像特征提取)
这一阶段,需要决定描述图像的哪一方面。图像的可描述特征很多、包括颜色、形状、纹理、能量等,而颜色有分为很多种,如颜色直方图、颜色矩等。在这一阶段,我们选定要提取的颜色特征,根据应用的不同,选取的颜色特征可以是一种或多种。
2)索引化数据集(存储)
现在有了图像描述符,接着就是将这个图像描述符应用得到数据集中的每幅图像,提取这些图像的特征,将其存储起来(如CSV文件、RDBMS、Redis数据库中),这样后续步骤就能使用以便比较。
3)定义相似矩阵
很好,现在有了许多特征向量。但如何比较这些特征向量呢?比较常用的流行的相似性度量方式有:欧几里德距离、余弦距离、或卡方距离、巴氏距离、闵式距离、相关性等。但实际中取决于两点:①、数据集;②、提取的特征类型。
4)检索
上面步骤都完成了,剩下的就是根据输入的图片,从图像库中检索相似的图像并返回了。用户会向系统提交一幅需要搜索的图片(例如从上传窗口或通过移动App提交),而你的任务是:1、提取这幅图像的特征;2、使用相似度函数将这幅图像的特征与已经索引化的特征进行比较。这样,只需根据相似度函数的结果,返回相关的图像就可以了。
http://blog.csdn.net/kezunhai/article/details/46417041
同样是图像检索方向的研究生,马上研三,对于这个问题,想谈谈。
图像检索这块看似小众,实则商业需求还是比较大的,从面向需求方面来看,主要有面向类别的图像检索以及针对object
retrieval_r(也作duplicate search)。
关于面向类别的图像检索,举个例子,上传一张“老虎”的图片,面向类别的图片搜索需要找到的是那些包含老虎(不管老虎是哪个品种)的图片,并将它们排在搜索结果的最前面,来个具体的:
这类针对类别的图像检索,采用CNN卷积神经网络可以解决得相当不错,因为CNN具备很强的类别泛化能力。这一类搜索主要面向图像搜索引擎。
另一类是object retrieval_r(也作duplicate
search),这一类搜索主要是对上传的一幅图片,搜索出图片中包含有该物体的图片,举个例子:
上图中是上传的一幅某建筑的图片,后面是搜索到的包含该建筑物的图片。从技术上来说,主要用BoW词袋模型、VLAD以及Fisher向量,这一类描述子因为用的是SIFT,具有光照不变形以及一定的几何旋转不变性,所以这三类差不多是科研上做object
retrieval_r(也作duplicate
search)的主流方法(工业界不知道是不是采用的这些方法)。这一类搜索需求更广,应用空间更大,比如同款衣服(鞋子)的搜索、人脸搜索、重复样本去重等等。总之这一类应用,只要你想不到的,但它们确实很多公司有这方面的需求。
所以关于图像检索这块,个人觉得掌握了BoW、VLAD、FV以及CNN就差不多,特征融合如果也熟悉的话,更好。你学这些的时候,肯定会顺带了解了计算机视觉以及机器学习方面的很多东西。所以基础理论应该没什么问题。
再说编程语言以及数据结构方面的,这一块是笔试面试时一定会考到的东西。编程语言的话,差不多都是考C++,这个得多看多练,《C++
primer》和《剑指offfer》这两本书多拿出来看看,编程语言这东西,最终还是要落到实处,不会写代码的图像检索高手,都是花架子,因为很多东西,只有在自己去实现的时候,才会发现很多细节的东西需要注意,而这些东西,我们称之为经验。
写得比较凌乱,再次总结归纳一下:掌握图像检索的基础理论以及主流的检索模型,多多写写代码。
以上,就酱紫。
基于内容的图像检索技术( CBIR,contentbased
image retrieval) [1]( 如图1 所示) 指的是用于
搜索的对象本身就是一幅图像,或者是对于图像内
容的特征描述. CBIR 进行检索的方式是通过提取
图像底层特征,计算比较这些特征和搜索对象之间
的距离,来度量两个图片的相似程度. 人们通常提
取颜色( RGB,LAB 或HSV) 、纹理、GIST[2]、尺度不
变特性转换描述子[3] ( SIFT,scale-invariant feature
transform) 和F 方向梯度直方图特征[4]( HoG,histogram
of oriented gradients) 等手工设计的特征对图像
内容进行表示. 虽然CBIR 在过去的十几年中取得
了大量的科研成果并建立起了一些研究型或商用型
的图像检索系统,但大多数的图像检索性能还不能
满足人们的要求. 究其原因,主要是底层特征和高
最近,随着深度学习[6] 的发展,卷积神经网
络[7]( CNN,convolutional neural network) 在图像识
别领域取得了重要进展,如图像分类和物体检测.
特别是,Krizhevsky 等[8]提出的CNN 架构在ILSVRC
2012 [9]( imagenet large scale visual recognition
challenge)
中取得了巨大突破( 在图像分类任务中,性能
比传统手工设计特征的架构提升了10%) . 随后,
Razavian 等[10]工作指出,通过在大规模图像库上预
训练得到的CNN 模型可以用来提取图像的视觉特
征( CNN visual features) ,并应用于各类图像识别任
务,如场景分类和多标签分类等. 虽然CNN 在图像
识别领域取得了长足进步,但基于CNN 视觉特征的
图像检索方面的工作还很少. 主要对比分析了传统
视觉特征和CNN 视觉特征在CBIR 中的性能表现,
并提出了一些值得深入研究的方向. 贡献主要包含
以下几个方面:
python 图像检索_深度学习图像检索相关推荐
- ann人工神经网络_深度学习-人工神经网络(ANN)
ann人工神经网络 Building your first neural network in less than 30 lines of code. 用不到30行代码构建您的第一个神经网络. 1.W ...
- 脑电波之父:汉斯·贝格尔_深度学习,认识聪明的汉斯
脑电波之父:汉斯·贝格尔 Around 1900, a German farmer made an extraordinary claim: he had taught a horse basic a ...
- 如何用 Python 进行基于深度学习的计算机视觉项目开发?
令人惊喜的"智能"年代 深度学习有着广阔的前景 我们正处在一个"智能"的年代,比如智能手机中的语音助手.机器翻译和人脸识别:战胜过日本将棋冠军.国际象棋冠军, ...
- 深度学习 图像分类_深度学习时代您应该阅读的10篇文章了解图像分类
深度学习 图像分类 前言 (Foreword) Computer vision is a subject to convert images and videos into machine-under ...
- Python机器学习、深度学习库总结(内含大量示例,建议收藏)
Python机器学习.深度学习库总结(内含大量示例,建议收藏) 前言 python常用机器学习及深度学习库介绍 总结与分类 python 常用机器学习及深度学习库总结 分类 更多 前言 目前,随着人工 ...
- python调用c++深度学习模型生成的dll(传入图片,返回多个结果)
这里主要通过python调用c++深度学习模型,传入图片,c++处理,并返回结果,python接收结果,这个过程的接口如何设计转换. python端代码接口 # 定义dll返回的结果类型,这里应该和c ...
- Python机器学习、深度学习库总结
Python机器学习.深度学习库总结(内含大量示例,建议收藏) 前言 python常用机器学习及深度学习库介绍 总结与分类 python 常用机器学习及深度学习库总结 分类 更多 前言 为了大家能够对 ...
- 30个顶级Python库 | 用于深度学习、自然语言处理和计算机视觉
CDA数据分析师 出品 作者:Matthew Mayo 编译:Mika 今天我们来盘点一下有哪些用于深度学习.自然语言处理和计算机视觉的顶级Python库. 我们尽力将每个库按预期的使用情况进行归类, ...
- 处理器_深度学习及 KPU 基础知识
kpu 处理器_深度学习及 KPU 基础知识_weixin_39909212的博客-CSDN博客深度学习及 KPU 基础知识1. 阅读完本章文档可以了解什么?了解深度学习一些基础内容了解 K210 内 ...
- 深度学习深度前馈网络_深度学习前馈网络中的讲义第4部分
深度学习深度前馈网络 FAU深度学习讲义 (FAU Lecture Notes in Deep Learning) These are the lecture notes for FAU's YouT ...
最新文章
- 2021年机器学习什么风向?谷歌大神Quoc Le:把注意力放在MLP上
- Python爬虫爬取部分学校的新闻标题、时间、对应的新闻链接
- boost::detail::sp_typeinfo用法实例
- A+B Problem III -- ACM解决方法
- RUNOOB python练习题44
- Java8————Base64
- 测试 | 测试:你会这些命令吗?
- 为什么公司要对员工的薪资保密?
- VMware虚拟机下Ubuntu安装VMware Tools详解
- DNF装备强化的算法分析与实现
- xml文件编辑器----foxe_CHS
- android wifi 信道,WiFi不稳定经常断?手机WiFi信道小工具【图】_Android资讯_太平洋电脑网...
- excel取消密码_【Excel神技能】如何锁定Excel表中的公式,防止被修改?
- 人工智能中,自动驾驶汽车是如何自动识别交通标志的?
- 图片处理中对于Sigmod函数图像的理解
- (FortiGate)飞塔防火墙快速初始化管理员密码
- nslookup命令反解ip_桌面运维常用命令
- LeetCode 1905. 统计子岛屿
- 3975: 人工智能(障)?
- js简单的文本编辑器(所见即所得)
热门文章
- ASP.Net MVC开发基础学习笔记(9):查看详情、编辑数据、删除数据
- 深度卷积神经网络(一)
- 开发流程与管理--《人月神话》精简
- python爬取上海链家网二手房数据
- MUI框架常用代码段
- php运算符包括,php运算符有哪些 - php完全自学手册 - php中文网手册
- php 变量加的作用是什么,php变量的定义和作用是什么 - php完全自学手册 - php中文网手册...
- 计算机毕业设计Java大学生旅游拼团网站(源码+系统+mysql数据库+lw文档)
- 策略模式探究(二)多个门禁对接使用策略模式
- 【WiFi】wifi信道