专栏《图像分类》正式完结啦!我们从数据集展开讲解,由最基本的多类别图像分类一步步深入到细粒度图像分类、多标签图像分类,再到更加有难度的无监督图像分类,随后我们又对图像分类中面临的各种问题展开描述,较为全面的汇总了图像分类领域的相关内容。至此,我们再对整个图像分类专栏的内容进行一个大总结!

作者 | 郭冰洋 言有三

编辑 | 言有三

1 数据集和经典网络的交响曲

深度学习作为数据驱动的工具,需要大量优质的数据集才可以展开相应的工作。我们详细总结了现阶段图像分类各个领域的数据,并指出其适用的分类任务,为各位读者展开相应的工作,提供了指南针。

同时,我们对经典的图像分类网络进行了总结,详细介绍了图像分类发展史上的重大突破和典型的设计思想。

2 多类别图像分类

多类别图像分类是图像分类最基本的一种,即对含有单一类别目标的图像进行分类。多类别图像分类现在已经融入至生活的方方面面,成功的应用至人脸识别等多个领域。

构建一个完整的图像分类任务,需要通过选择开源框架、构建并读取数据集、网络框架搭建、训练并调试参数、测试准确率五个步骤,本文以pytorch开源框架作为工具,白细胞作为数据集,完成了一个多类别图像分类任务。

3 多标签图像分类

现实生活中的图片中往往包含多个类别的物体,相较于多类别图像分类,这也更加符合人的认知习惯。

多标签图像分类可以告知我们图像中是否同时包含这些内容,这也能够更好地解决实际生活中的问题。

在诸多解决方案中,通过标签转化的方式能够快速的将多类别图像分类的思想迁移到多标签图像分类中。在实战部分,我们借助这个思想,利用ResNet 50作为基础框架,以pascal voc数据集实现了多标签图像分类。

4 细粒度图像分类

细粒度图像分类是在区分出基本类别的基础上,进行更精细的子类划分,如区分鸟的种类、车的款式、狗的品种等,目前在工业界和实际生活中有着广泛的业务需求和应用场景。

细粒度图像相较于粗粒度图像具有更加相似的外观和特征,加之采集中存在姿态、视角、光照、遮挡、背景干扰等影响,导致数据呈现类间差异性大、类内差异性小的现象,从而使分类更加具有难度。

实战部分我们通过经典的双线性网络结构,以CUB数据集完成了一个基本的细粒度分类任务。

5 无监督图像分类

现阶段的图像分类任务在很大程度上是靠监督学习实现的,即每个样本都有其对应的标签,通过深度神经网络来不断学习每个标签所对应的特征,并最终实现分类。这种情况下,数据集的容量、标签的质量往往对模型的性能起到决定性的作用。

高质量数据集自然会带来标注的困难,耗费大量的人力财力。在这种情况下,如何减少标签信息同时保证分类精度,也成了进一步的研究目标,这也是无监督图像分类的发展方向。

6 类别不平衡

类别不平衡是指分类任务中不同类别的训练样本数目相差较大的情况,通常是由于样本较难采集或样本示例较少而引起的,经常出现在疾病类别诊断、欺诈类型判别等任务中。

本篇文章将对目前涉及到的相关解决方案进行汇总,共分为数据层面、算法层面、数据和算法混合层面三个方面,列举具有代表性的方案阐述,以供读者参考。

7 标签噪声

在数据集制作过程中,由于主观、客观的原因,会导致标签噪声的出现,其存在会对最终的分类模型性能造成一定的影响。因此,在实际应用过程中,总是要对现有的数据集进行清洗,以避免标签噪声的干扰。

本文介绍了标签噪声的解决方式,并通过迭代训练的方式进行实战。目前还没有一个完全高效妥善的方式可以解决这一问题,仍然处于一个研究发展的阶段。

8 对抗攻击

基于深度学习的图像分类网络,大多是在精心制作的数据集下进行训练,并完成相应的部署,对于数据集之外的图像或稍加改造的图像,网络的识别能力往往会受到一定的影响。

在愈发重视安全信息的今天,如何提升网络模型对噪声、干扰等对抗样本的鲁棒性,是图像分类的进一步研究目标。

9 可视化

觉得深度学习模型像个黑盒子?不能理解它的工作原理?那就可视化做起来,在这里我们给大家总结了图像分类模型可视化的综述和实战案例。

10 图像分类综述

此外,我们还总结了图像分类的一个综述,用于帮助大家理解不同层级的的图像分类的原理,这也是本专栏开设前的一篇总结文章。

11 图像分类模型架构

去年我们还总结了12期主流的深度学习模型架构的解读,其中的大部分内容都是图像分类模型,供初学者方便进行系统性学习。如果想了解更多的千奇百怪的模型架构,可以申请加入有三AI知识星球,几百期内容等你来读。

12 主流开源框架分类项目

为了让大家更加容易上手,有三AI开源了12大深度学习开源框架的图像分类项目,从数据准备,模型定义,可视化,训练和测试,图文教程和代码俱全,你还在等什么呢?

总结

几个月的时间来,在自己的努力和三哥的指导下,图像分类专栏终于完结了。希望各位能够在专栏中有所收获,得到一点提升。同时,非常感谢大家对我提出的意见和指导,这些都令我受益匪浅。

这段时间对于我自己来说是一个自我提升、不断突破的阶段。不仅巩固了自己的基础知识,也收获了非常多的经历。这些经历让我明白,踏踏实实做事,向着目标不断努力,就一定会有收获。

最后,还是送给大家专栏开始的那段话:

有志者,事竟成,百二秦关终属楚。

苦心人,天不负,三千越甲可吞吴。

Ps:大家一定要持续关注有三AI哦!

知识星球推荐

有三AI知识星球由言有三维护,内设AI知识汇总,AI书籍,网络结构,看图猜技术,数据集,项目开发,Github推荐,AI1000问八大学习板块,了解详细可以阅读:

本月主题是生成对抗网络GAN,欢迎大家加入学习,添加有三微信Longlongtogo即可申请优惠加入。

转载文章请后台联系

侵权必究

往期精选

【完结】16篇图像分类干货文章总结,从理论到实践全流程大盘点!相关推荐

  1. 花了 6 个月整理了 100 篇 Android 干货文章

    距上次「花了 4 个月整理了 50 篇 Android 干货文章」已经2个月了,在这2个月中新增了50篇精选文章. 接下来再来整理一波. 热门技术 巧用Android多进程,微信,微博等主流App都在 ...

  2. 100 篇 Android 干货文章

    热门技术 巧用Android多进程,微信,微博等主流App都在用 Google I/O '17 新推出的物理动画库 Android Studio 实用小技巧 那些年Android黑科技①:只要活着,就 ...

  3. SPARK全栈 全流程 大数据实战 之 技术选型篇

    2019独角兽企业重金招聘Python工程师标准>>> ###一.技术选型,环境搭建安装及生产部署 ####1.大数据研发调研和需求分析 如果 你已经或正在尝试搭建一套大数据环境或生 ...

  4. 干货满满!MES生产制造管理全流程分析

    阅读本文您将了解:1.什么是MES生产管理流程:2.MES生产管理流程具体步骤:3.实施MES生产管理流程优势:4.MES生产管理流程中可能会遇见的问题. 一.什么是MES生产管理流程 MES生产管理 ...

  5. 【杂谈】篇篇精华,有三AI不得不看的技术综述(超过100篇核心干货)

    文/编辑 | 言有三 有三AI很少写零散的报导,因为我们的文章通常都是提炼与总结,一般遇到一个新方向,找技术综述读一读是最合适的开始,大家也可以拓展一下自己的知识边界,今天总结一下有三AI迄今为止发过 ...

  6. 【杂谈】循序渐进,有三AI不得不看的技术综述(超过100篇核心干货)

    文/编辑 | 言有三 有三AI很少写零散的报导,因为我们的文章通常都是提炼与总结,一般遇到一个新方向,找技术综述读一读是最合适的开始,大家也可以拓展一下自己的知识边界,今天总结一下有三AI迄今为止发过 ...

  7. 【总结】循序渐进,有三AI不得不看的技术综述(超过100篇核心干货)

    文/编辑 | 言有三 有三AI很少写零散的报导,因为我们的文章通常都是提炼与总结,一般遇到一个新方向,找技术综述读一读是最合适的开始,大家也可以拓展一下自己的知识边界,今天总结一下有三AI迄今为止发过 ...

  8. 【杂谈】有三AI不得不看的技术综述(超过100篇核心干货)

    文/编辑 | 言有三 有三AI很少写零散的报导,因为我们的文章通常都是提炼与总结,一般遇到一个新方向,找技术综述读一读是最合适的开始,大家也可以拓展一下自己的知识边界,今天总结一下有三AI迄今为止发过 ...

  9. 计算机信息学院开学演讲稿,大学开学演讲稿范文(精选16篇)

    大学开学演讲稿范文(精选16篇) 演讲稿可以提高演讲人的自信心,有助发言人更好地展现自己.在学习.工作生活中,演讲稿的使用越来越广泛,演讲稿的注意事项有许多,你确定会写吗?下面是小编帮大家整理的大学开 ...

最新文章

  1. Metrics.NET源码阅读笔记
  2. 使用SpringBoot框架和SpringSecurity框架整合出现because its MIME type ('text/html') is not executable
  3. 用django2.1开发公司官网(上)
  4. [轮子系列]Google Guava之CharMatcher源码分析
  5. 东南大学计算机网络_东南大学,2020年东南大学高考录取分数线分析
  6. react把表格渲染好ui_react 入坑笔记(五) - 条件渲染和列表渲染
  7. Linux-Shell脚本学习心得(第二天)
  8. css中调整高度充满_css - DIV高度怎样充满容器?
  9. 关于idea中运行maven项目报错显示找不到包或符号的问题——终极方案
  10. springboot 使用mybatis与mybatis-generator与druid (gradle构建)
  11. Linux网络驱动MDIO及Phy梳理
  12. c4d渲染测试软件,C4D常用的4大主流渲染器
  13. 五年了,我在 CSDN 的两个一百万。
  14. 7-11 公约数与公倍数 (10 分)
  15. cocos 躲避球游戏(1) --创建项目和场景切换
  16. 运营商开始悄悄火拼5G价格战,19元套餐开始涌现
  17. 【微信朋友圈,如何测】
  18. modelsim 无objects窗口 的解决方法
  19. 3星|《一万年的爆发:文明如何加速人类进化》:那些拒绝承认欧洲征服和定居美洲过程中生物学差异的人,事实上也是在否认达尔文进化论...
  20. 记一次简单的清理挖矿程序过程-kdevtmpfsi

热门文章

  1. cdrx4被禁用怎么解决_双显卡怎么切换到独立显卡
  2. 杭电1232 畅通工程
  3. 深入理解Spring MVC Controller返回String类型导致中文乱码的问题。
  4. CSS选择器、盒子模型及布局
  5. html拖拽显示获取坐标,html界面元素拖拽实现[超简单]
  6. SpringData JPA条件查询、排序、分页查询
  7. python输出变量代码_Python中变量的输入输出实例代码详解
  8. php7抓取网页数据,php7-远程获取api接口或网页内容
  9. 导入之后再执行一个方法_种花生再撒点儿石灰,掌握这两个方法之后,提高产量基本没问题!...
  10. 【超实用】HCIE-RS面试真题分享