大家好,今天我将在有三AI开设新专栏《图像分类》。在这个专栏中,我将全方位介绍图像分类相关知识,并结合不同任务需求进行实战,和大家一同走近这看似简单却包罗万象的基础性技术,同时指导计算机视觉、深度学习领域的初学者快速、准确、全面地掌握图像分类的相关知识。

作者&编辑 | 郭冰洋

1 图像分类简介

图像分类,即通过某种分类算法使计算机判断输入图像所属的类别。作为计算机视觉的基础性任务,图像分类是后续目标检测、图像分割的重要基础,几乎所有的工作都建立在图像分类之上。近年来,随着深度学习的发展,图像分类取得了显著进步,并在许多数据集上达到了超越人类的水准。越来越多的人们也开始重视对图像分类和深度学习的研究。

2 专栏目录与内容

目前,众多教材和课程均以图像分类作为深度学习的入门基础,本专栏的开设目的也在于引导初学者快速、准确地进入计算机视觉领域和深度学习领域,为后续的工作打下一个良好的基础。

目前,图像分类专栏内容规划如上图所示,采用理论和实战相结合的方法,针对子专题所涉及到的内容,均会进行相应的实践操作,加深并强化知识的理解。

1、多类别图像分类

专栏将由最基本的多类别图像分类为基础,介绍传统的CNN分类网络及其相应的特点,并动手搭建一个多类别图像分类网络,将涉及到图像数据读取、神经网络搭建、评价指标计算等多个部分,通过完整的实战实现图像处理和深度学习的入门。

进行完初始的网络搭建之后,我们将介绍提升网络性能的相关策略,从原理和工程的角度理解超参数的选择、网络层数设置、数据处理等多种方法的优点和缺点,更进一步的加深对分类网络的细节理解。

2、细粒度图像分类

多类别图像分类网络在类别差异比较大的数据集上,甚至可以取得超过人类的准确率。但是当类别之间的差异非常小(如不同品牌之间的车型往往非常相似),亦或是类内差距非常大的情况下(如桌椅的造型非常之多),其准确度会大打折扣,这就涉及到细粒度图像分类的相关研究。

第二部分我们将深入了解细粒度图像分类的相关研究现状,并结合两个实际数据集,实现细粒度图像分类,并与多类别图像分类进行对比,发现其二者之间的差异,以达到具体问题具体分析的目的。

3、多标签图像分类

不论是多类别还是细粒度图像分类,单张图片中往往只含有一个类别信息,但在实际生活和工程应用中,某张图片中包含着若干个目标,如上图中含有人、狗和树等多个类别信息。如何对多标签图像数据进行划分和训练,则是一个更具有挑战性的问题。专栏第三部分将以Pascal VOC数据集为基准,实现多标签图像分类的数据读取及网络构建。

4、实例级图像分类和无/弱监督图像分类

实例级别的分类是指,对图像中每个类别的子类或个体进行划分,其实质和目标检测中bounding box的分类训练相同。该任务的难点在于,不仅要区分每个类别,还要正确区分每一个个体。

无/弱监督分类则是减少数据标记的参与程度,让网络自动划分不同的类别。由于缺乏或没有标记信息,无/弱监督图像分类仅可以将不同类别的物体进行聚类,但并不能告知其类别到底是什么。例如,一个包含猫和狗图片的数据集,通过无/弱监督分类,可以将其划分成两部分,但具体哪部分是猫,哪部分是狗,则需要人为的进行判别。

上述两个问题是目前图像分类中更具有挑战性且研究相对较难的部分,专栏的第四部分将对这两种图像分类的研究现状和进展进行介绍,为感兴趣的读者提供一定的思路。

5、其他

除了上述四个部分,专栏还将对实际应用过程中可能出现的问题进行汇总,如样本不平衡、无穷负样本等,并结合现有的研究进展,进行相关的方案解读。同样,也会对分类网络的若干应用进行介绍,如网络可视化、参数可视化等,使你在整个学习过程中更好地了解网络,认清神经网络到底在干什么。

3 写在后面的话

俗话说,万事开头难。想到自己进入图像处理和深度学习领域踩过的诸多大坑,一直都想把自己的一些经验和想法与大家进行分享,希望能帮助到更多的初学者避开一些弯路。

在有三的帮助和鼓励下,萌生了开设专栏的念头。才疏学浅,不敢造次。仅仅希望通过专栏的开设,竭尽所能帮助需要帮助的人,也进一步提高自己写作的能力和基础知识的巩固。

最后,送给大家一句最喜欢的话:

“有志者,事竟成,百二秦关终属楚;苦心人,天不负,三千越甲可吞吴”

有三AI夏季划

有三AI夏季划进行中,欢迎了解并加入,系统性成长为中级CV算法工程师。

有三AI知识星球-今日精选

Residual Attention Network

残差网络和注意力机制的结合,Residual Attention Network。

转载文章请后台联系

侵权必究

往期相关

【图像分类】分类专栏正式上线啦!初入CV、AI你需要一份指南针!相关推荐

  1. 初入CV行业得海尔青睐,云通讯独角兽容联发力视觉智能产业

    近几年CV(计算机视觉)一直是AI最火的技术领域之一.经过几年的攻城略地,国内市场已经形成了旷视.依图.商汤.云从这「CV四小龙」盘踞的格局. 但目前CV应用仍然局限在人脸识别领域,应用范围有限并且容 ...

  2. 【周报6.10-6.16】NLP,RL,GAN,DL框架等重磅专栏齐上线,这个月的有三AI你值得拥有...

    今天开设新专栏<有三AI周报>,以后会在每周日总结过去的一周里有三AI发生的重要事情. 编辑 | 言有三 本周的主要内容是开拓新的领域,加上上周的内容,共计6个新专栏发布,涵盖GAN,强化 ...

  3. 正式上线|只需5秒,国产AI作画神器到底有多绝?

    皮卡智能(PicUP.AI)在经过反复测试,终于正式上线了!相比其他AI作画神器,PicUP速度更快,生成效果更好,每5秒钟就能生成一张图. 用户可以发挥想象,输入文字描述后,便可生成1:1的图片.还 ...

  4. 堡垒前线7月30日服务器维护,堡垒前线7月24日停服维护公告 全新功能初心岛正式上线...

    堡垒前线7月24日停服维护公告 全新功能初心岛正式上线 2019-07-23 15:17 作者:佚名 来源:本站整理 浏览:597 堡垒前线7月24日将要进行停服维护公告,开启了筑梦乐园初心岛玩家可以 ...

  5. 【青春须早为,岂能长少年】一个初入职场程序员的阶段总结

    作者:陌北有棵树,Java人,架构师社区合伙人! 2019届毕业的小伙伴们,都应该已经入职快两个月了吧,从学校踏入工作,想必都有很多新的感悟和想法吧,我在这里写下我作为新人的的思考和总结,困惑与迷茫. ...

  6. 「每周论文推荐」 初入深度学习CV领域必读的几篇文章

    https://www.toutiao.com/a6718570271269192200/ 很多朋友都希望我们开通论文推荐和阅读板块,那就开吧,此专栏名为<每周论文推荐>.在这个专栏里,还 ...

  7. 【每周论文推荐】 初入深度学习CV领域必读的几篇文章

    很多朋友都希望我们开通论文推荐和阅读板块,那就开吧,此专栏名为<每周论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题 ...

  8. 初入前端,面对一个项目应注意哪些?

    前言: 对于初入职场的前端小白来说,一整个项目来了,顿时感觉压力山大,张皇失措,也总会感到手忙脚乱.其实不用怕,拆分步骤,把每个步骤做好,做细,一切都迎刃而解,犹如顺藤摸瓜般畅快淋漓. 目录: 概念的 ...

  9. Oracle宣布在云上正式上线 自治事务处理数据库

    在 8 月7日,Oracle 宣布在云上正式上线自治事务处理数据库,这个名词 ATP应对于早前发布的 ADW(今年 3月份 Oracle 宣布正式上线的自治数据仓库数据库). 完整的发布会视频链接在这 ...

最新文章

  1. 算法结构1.插入排序
  2. python - 多线程简单实现
  3. 视频直播技术详解(2)采集
  4. Alpha 冲刺 (10/10)
  5. 计算机网掉了,非常急电脑掉网我电脑上上网就会自己掉网不显示网络断开但一切有关上 爱问知识人...
  6. iOS之实现图片的压缩、解压缩、模糊、置灰、马赛克、黑白化、调色等处理
  7. 数独求解 DFS DLX
  8. Java 使用枚举类的实例
  9. how is opportunity detail page display first item by default
  10. 超详细设置 Idea 类注释模板和方法注释模板
  11. echarts 统计图如何实现打印导出
  12. AdGuard Home 使用设置以及DNS测速软件
  13. Java牛客项目课_仿牛客网讨论区_第七章
  14. 四六级考试中的计算机类文章,四六级英语考试进入机考时代
  15. Windows 8 六大关机模式 详解
  16. WordNet介绍,一个开放知识图谱
  17. 黑苹果Mac系统快捷键修改
  18. 计算机科学的主要研究领域是,斯坦福大学计算机科学专业研究领域有哪些?
  19. 在windows下启动容器时,报 the input device is not a TTY. If you are using mintty, try prefixing the command
  20. 管理学中的 Expectancy Theory - 期望理论

热门文章

  1. 今天悄悄的给你说几个HashCode的破事。
  2. Android中的AsyncTask异步加载图片
  3. 【Intellij IDEA系列】IDEA右键没有Git或svn处理方法
  4. QT使用之 手指滑动 | 物理惯性继续滑动动画的实现,根据不同速度实现不同动画效果
  5. Spring-data-redis入门
  6. 线性回归数据_数据科学笔记(三)——线性回归
  7. 纯文本文件的字符编码未声明_浅谈几种常见的字符编码
  8. ei指什么_SCI、EI、SSCI和ISTP的区别!
  9. captura录屏没声音_电脑录屏有哪些好用的软件呢?
  10. 龙门吊matlab,龙门吊车重物防摆双闭环PID控制设计.doc