Introduction

细粒度图像识别 (fine-grained image recognition),即 精细化分类

精细化分类

识别出物体的大类别(比如:计算机、手机、水杯等)较易,但如果进一步去判断更为精细化的物体分类名称,则难度极大。

最大的挑战在于,同一大类别下 不同 子类别 间的 视觉差异 极小。因此,精细化分类 所需的图像分辨率 较高。

目前,精细化分类的方法主要有以下两类:

基于图像重要区域定位的方法:该方法集中探讨如何利用弱监督的信息自动找到图像中有判别力的区域,从而达到精细化分类的目的。

基于图像精细化特征表达的方法:该方法提出使用高维度的图像特征(如:bilinear vector)对图像信息进行高阶编码,以达到准确分类的目的。

RA-CNN

MSRA通过观察发现,对于精细化物体分类问题,其实形态、轮廓特征显得不那么重要,而细节纹理特征则起到了主导作用。

因此提出了 “将判别力区域的定位和精细化特征的学习联合进行优化” 的构想,从而让两者在学习的过程中相互强化,也由此诞生了 “Recurrent Attention Convolutional Neural Network”(RA-CNN,基于递归注意力模型的卷积神经网络)网络结构。

RA-CNN 网络可以更精准地找到图像中有判别力的子区域,然后采用高分辨率、精细化特征描述这些区域,进而大大提高精细化物体分类的精度:

该项工作已经被CVPR 2017接收。


[1] 基于递归注意力模型的卷积神经网络:让精细化物体分类成为现实
[2] RA-CNN

【深度学习】细粒度图像识别 (fine-grained image recognition)相关推荐

  1. [王晓刚]深度学习在图像识别中的研究进展与展望(转发)

    [王晓刚]深度学习在图像识别中的研究进展与展望(转发) (2015-06-04 08:27:56) 转载▼     深度学习是近十年来人工智能领域取得的最重要的突破之一.它在语音识别.自然语言处理.计 ...

  2. 【AI学院】有三AI博士小姐姐带你学深度学习之图像识别下篇,附上篇回顾

    带学营第一期(上)圆满结束回顾 有三 AI 深度学习之图像识别带学营第一期(上)圆满结束,这一期我们主要的培训内容是深度学习基础+项目实战(人脸表情识别和鸟类细粒度识别). 以上的课程可以说是干货满满 ...

  3. 【AI学院】新手如何学CV?老司机带学有三书籍《深度学习之图像识别》,赠书8本...

    为什么以及怎么学计算机视觉? 作为一个普通的程序员,如果能转型成为一个计算机视觉算法工程师,带来的不仅是高薪,还有从劳动密集型工种转化为智力密集型工种带来的"阶级跃迁".因为相对于 ...

  4. 基于深度学习的图像识别进展:百度的若干实践

    来源:<中国计算机学会通讯> 2015年第4期<专题> 作者:都大龙 余轶南 罗 恒 等 概述:深度学习和图像识别 近年来在人工智能领域最受关注的,非深度学习莫属.自2006年 ...

  5. 论题:基于深度学习的图像识别系统

    本文为论题:基于深度学习的图像识别系统 的编写思路. 目录 摘要: 引言 2.深度学习技术及卷积神经网络原理 3.图像识别系统设计 4.实验评估与改进策略 5.改进策略及未来发展趋势 6.结论 摘要: ...

  6. 深度学习细粒度图像研究汇总

    引言 因为之前做过一些细粒度图像的研究,所以对该方向比较敏感,特此将看到的一些文章汇总到这里. 2022-09-15 Fine-Grained Image Analysis with Deep Lea ...

  7. 王晓刚:深度学习在图像识别中的研究进展与展望

    深度学习是近十年来人工智能领域取得的最重要的突破之一.它在语音识别.自然语言处理.计算机视觉.图像与视频分析.多媒体等诸多领域都取得了巨大成功.本文将重点介绍深度学习在物体识别.物体检测.视频分析的最 ...

  8. 基于深度学习的图像识别模型研究综述

    基于深度学习的图像识别模型研究综述 摘要:深度学习是机器学习研究中的一个新的领域,其目的在于训练计算机完成自主学习.判断.决策等人类行为并建立.模拟人脑进行分析学习的神经网络,它模仿人类大脑的机制来解 ...

  9. 深度学习在图像识别中的发展进程与展望

    本文是转载,出自:http://blog.csdn.net/linj_m/article/details/46351053点击打开链接 深度学习是近十年来人工智能领域取得的最重要的突破之一.它在语音识 ...

  10. 读“基于深度学习的图像识别技术研究综述”有感

    "基于深度学习的图像识别技术研究综述"总结 现在流行的图像识别技术都是基于深度学习的算法,经过前辈们的探索改进,图像识别技术经历很多阶段,现如今图像识别技术已经广泛的应用于生活的方 ...

最新文章

  1. c#.net调用pdf2swf.exe将pdf文件转换为swf,vs中运行正常,布署IIS服务器部署转换后文字部分为空白...
  2. Python的if __name__ == ‘__main__‘:的作用
  3. 802.11ac/ax (wifi6)中的Beamforming技术介绍
  4. vs2010 ATL创建windows服务程序
  5. MariaDB存储引擎简介
  6. Spark Streaming 实战案例(二) Transformation操作
  7. glibc版本查看_[译] 写一个简单的内存分配器(替换glibc中的malloc函数)
  8. clickhouse分布式查询
  9. 一个解决OnNcLButtonUp不能响应消息问题的更好办法
  10. 杭州市建筑物矢量数据(Shp格式+带高度)
  11. python信息安全书籍_2018年信息安全从业者书单推荐
  12. Word删除与新增页眉或页脚的横线
  13. ML-Agents案例之金字塔
  14. 为什么一个简单腹泻,服用了附子理中丸后,会绵延十年不愈?(转)
  15. SpringBoot 日期转换
  16. 基于rancheros离线安装Habor以及Rancher
  17. 极速入门Gamemaker编程语言
  18. 微信小程序编辑器,支持wxss,支持wxml
  19. 绩效考核-项目经理绩效考核指标
  20. 2022年O2O平台还值得做吗

热门文章

  1. Go语言学习笔记 (网络编程)
  2. vue2前端实现网页截图
  3. 中科磐云 隐写术应用
  4. Windows下更改C/C++控制台程序文本输出颜色
  5. python中frame是什么意思_“***Oldest frame”在ipdb中是什么意思?
  6. Prolog教程 4
  7. 五金模具与塑胶模具的区别和各自的优点
  8. 输入三个数判断能否构成直角三角形 C语言
  9. 程序员如何保护眼睛?
  10. Recordset里的记录数