专栏《图像分类》正式完结啦!我们从数据集展开讲解,由最基本的多类别图像分类一步步深入到细粒度图像分类、多标签图像分类,再到更加有难度的无监督图像分类,随后我们又对图像分类中面临的各种问题展开描述,较为全面的汇总了图像分类领域的相关内容。至此,我们再对整个图像分类专栏的内容进行一个大总结!

作者 | 郭冰洋 言有三

编辑 | 言有三

1 数据集和经典网络的交响曲

深度学习作为数据驱动的工具,需要大量优质的数据集才可以展开相应的工作。我们详细总结了现阶段图像分类各个领域的数据,并指出其适用的分类任务,为各位读者展开相应的工作,提供了指南针。

同时,我们对经典的图像分类网络进行了总结,详细介绍了图像分类发展史上的重大突破和典型的设计思想。

  • 【图像分类】分类专栏正式上线啦!初入CV、AI你需要一份指南针!
  • 【图像分类】从数据集和经典网络开始

2 多类别图像分类

多类别图像分类是图像分类最基本的一种,即对含有单一类别目标的图像进行分类。多类别图像分类现在已经融入至生活的方方面面,成功的应用至人脸识别等多个领域。

构建一个完整的图像分类任务,需要通过选择开源框架、构建并读取数据集、网络框架搭建、训练并调试参数、测试准确率五个步骤,本文以pytorch开源框架作为工具,白细胞作为数据集,完成了一个多类别图像分类任务。

  • 【图像分类】 基于Pytorch的多类别图像分类实战

3 多标签图像分类

现实生活中的图片中往往包含多个类别的物体,相较于多类别图像分类,这也更加符合人的认知习惯。

多标签图像分类可以告知我们图像中是否同时包含这些内容,这也能够更好地解决实际生活中的问题。

在诸多解决方案中,通过标签转化的方式能够快速的将多类别图像分类的思想迁移到多标签图像分类中。在实战部分,我们借助这个思想,利用ResNet 50作为基础框架,以pascal voc数据集实现了多标签图像分类。

  • 【技术综述】多标签图像分类综述
  • 【图像分类】基于Pascal VOC2012增强数据的多标签图像分类实战

4 细粒度图像分类

细粒度图像分类是在区分出基本类别的基础上,进行更精细的子类划分,如区分鸟的种类、车的款式、狗的品种等,目前在工业界和实际生活中有着广泛的业务需求和应用场景。

细粒度图像相较于粗粒度图像具有更加相似的外观和特征,加之采集中存在姿态、视角、光照、遮挡、背景干扰等影响,导致数据呈现类间差异性大、类内差异性小的现象,从而使分类更加具有难度。

实战部分我们通过经典的双线性网络结构,以CUB数据集完成了一个基本的细粒度分类任务。

  • 【图像分类】细粒度图像分类是什么,有什么方法,发展的怎么样
  • 【图像分类】 基于Pytorch的细粒度图像分类实战

5 无监督图像分类

现阶段的图像分类任务在很大程度上是靠监督学习实现的,即每个样本都有其对应的标签,通过深度神经网络来不断学习每个标签所对应的特征,并最终实现分类。这种情况下,数据集的容量、标签的质量往往对模型的性能起到决定性的作用。

高质量数据集自然会带来标注的困难,耗费大量的人力财力。在这种情况下,如何减少标签信息同时保证分类精度,也成了进一步的研究目标,这也是无监督图像分类的发展方向。

  • 【图像分类】简述无监督图像分类发展现状

6 类别不平衡

类别不平衡是指分类任务中不同类别的训练样本数目相差较大的情况,通常是由于样本较难采集或样本示例较少而引起的,经常出现在疾病类别诊断、欺诈类型判别等任务中。

本篇文章将对目前涉及到的相关解决方案进行汇总,共分为数据层面、算法层面、数据和算法混合层面三个方面,列举具有代表性的方案阐述,以供读者参考。

  • 【图像分类】 关于图像分类中类别不平衡那些事

7 标签噪声

在数据集制作过程中,由于主观、客观的原因,会导致标签噪声的出现,其存在会对最终的分类模型性能造成一定的影响。因此,在实际应用过程中,总是要对现有的数据集进行清洗,以避免标签噪声的干扰。

本文介绍了标签噪声的解决方式,并通过迭代训练的方式进行实战。目前还没有一个完全高效妥善的方式可以解决这一问题,仍然处于一个研究发展的阶段。

  • 【图像分类】 标签噪声对分类性能会有什么样的影响?

8 对抗攻击

基于深度学习的图像分类网络,大多是在精心制作的数据集下进行训练,并完成相应的部署,对于数据集之外的图像或稍加改造的图像,网络的识别能力往往会受到一定的影响。

在愈发重视安全信息的今天,如何提升网络模型对噪声、干扰等对抗样本的鲁棒性,是图像分类的进一步研究目标。

  • 【图像分类】图像分类中的对抗攻击是怎么回事?

9 可视化

觉得深度学习模型像个黑盒子?不能理解它的工作原理?那就可视化做起来,在这里我们给大家总结了图像分类模型可视化的综述和实战案例。

  • 【图像分类】 实战图像分类网络的可视化
  • 【技术综述】“看透”神经网络

10 图像分类综述

此外,我们还总结了图像分类的一个综述,用于帮助大家理解不同层级的的图像分类的原理,这也是本专栏开设前的一篇总结文章。

  • 【技术综述】你真的了解图像分类吗?

11 图像分类模型架构

去年我们还总结了12期主流的深度学习模型架构的解读,其中的大部分内容都是图像分类模型,供初学者方便进行系统性学习。如果想了解更多的千奇百怪的模型架构,可以申请加入有三AI知识星球,几百期内容等你来读。

  • 【完结】总结12大CNN主流模型架构设计思想

12 主流开源框架分类项目

为了让大家更加容易上手,有三AI开源了12大深度学习开源框架的图像分类项目,从数据准备,模型定义,可视化,训练和测试,图文教程和代码俱全,你还在等什么呢?

  • 【完结】给新手的12大深度学习开源框架快速入门项目

总结

几个月的时间来,在自己的努力和三哥的指导下,图像分类专栏终于完结了。希望各位能够在专栏中有所收获,得到一点提升。同时,非常感谢大家对我提出的意见和指导,这些都令我受益匪浅。

这段时间对于我自己来说是一个自我提升、不断突破的阶段。不仅巩固了自己的基础知识,也收获了非常多的经历。这些经历让我明白,踏踏实实做事,向着目标不断努力,就一定会有收获。

最后,还是送给大家专栏开始的那段话:

有志者,事竟成,百二秦关终属楚。

苦心人,天不负,三千越甲可吞吴。

Ps:大家一定要持续关注有三AI哦!

细粒度图像分类_【完结】16篇图像分类干货文章总结,从理论到实践全流程大盘点!...相关推荐

  1. 【完结】16篇图像分类干货文章总结,从理论到实践全流程大盘点!

    专栏<图像分类>正式完结啦!我们从数据集展开讲解,由最基本的多类别图像分类一步步深入到细粒度图像分类.多标签图像分类,再到更加有难度的无监督图像分类,随后我们又对图像分类中面临的各种问题展 ...

  2. 花了 6 个月整理了 100 篇 Android 干货文章

    距上次「花了 4 个月整理了 50 篇 Android 干货文章」已经2个月了,在这2个月中新增了50篇精选文章. 接下来再来整理一波. 热门技术 巧用Android多进程,微信,微博等主流App都在 ...

  3. 100 篇 Android 干货文章

    热门技术 巧用Android多进程,微信,微博等主流App都在用 Google I/O '17 新推出的物理动画库 Android Studio 实用小技巧 那些年Android黑科技①:只要活着,就 ...

  4. 写一段代码提高内存占用_记录一次生产环境中Redis内存增长异常排查全流程!...

    点击上方 IT牧场 ,选择 置顶或者星标 技术干货每日送达 最近 DBA 反馈线上的一个 Redis 资源已经超过了预先设计时的容量,并且已经进行了两次扩容,内存增长还在持续中,希望业务方排查一下容量 ...

  5. 半监督学习 图像分类_自我监督学习的图像分类。

    半监督学习 图像分类 In this post we explore the benefits of applying self-supervised learning to the image cl ...

  6. restful 接口文档_第 16 篇:别再手动管理接口文档了

    作者:HelloGitHub-追梦人物 大多数情况下,开发的接口都不是给开发这个接口的人用的,所以如果没有接口文档,别人就无法有哪些接口可以调用,即使知道了接口的 URL,也很难知道接口需要哪些参数, ...

  7. SPARK全栈 全流程 大数据实战 之 技术选型篇

    2019独角兽企业重金招聘Python工程师标准>>> ###一.技术选型,环境搭建安装及生产部署 ####1.大数据研发调研和需求分析 如果 你已经或正在尝试搭建一套大数据环境或生 ...

  8. keepalived mysql双主架构图_基于MySQL双主的高可用解决方案理论及实践

    MySQL在互联网应用中已经遍地开花,但是在银行系统中,还在生根发芽的阶段.本文记录的是根据某生产系统实际需求,对数据库高可用方案从需求.各高可用技术特点对比.实施.测试等过程进行整理,完善Mysql ...

  9. 干货满满!MES生产制造管理全流程分析

    阅读本文您将了解:1.什么是MES生产管理流程:2.MES生产管理流程具体步骤:3.实施MES生产管理流程优势:4.MES生产管理流程中可能会遇见的问题. 一.什么是MES生产管理流程 MES生产管理 ...

  10. android照片美颜项目_抖音美颜效果开源实现,从AI到美颜全流程讲解

    美颜和短视频 美颜相关APP可以说是现在手机上的必备的软件,例如抖音,快手,拍出的"照骗"和视频不加美颜效果,估计没有人敢传到网上.很多人一直好奇美颜类APP是如何开发出来的.本文 ...

最新文章

  1. 剑指offer--面试题14--收获
  2. 如何将 Linux 系统转移至 LVM 卷
  3. js 去重某个键值 数组对象_JS数组去重常见方法分析
  4. community 计算模块度_聚苯乙烯泡沫模块可以用在哪些建筑上?
  5. SpringBoot文档翻译系列——26.日志logging
  6. 手机弹出键盘 窗口改变事件
  7. VMware虚拟机安装Centos 8系统的详细操作步骤
  8. vue3.0实现jsoneditor组件
  9. Adobe PDF虚拟打印机 如何添加
  10. 不小心把文件夹管理员权限删除的回复方法
  11. phpStrom连接MySQL数据库
  12. EF Power Tool 参数错误 HRESULT:0x80070057 (E_INVALIDARG)) 解决办法
  13. echart 边框线_echarts 饼图给外层加边框
  14. cass块参照怎么改颜色_【干货】CASS自定义图斑填充技巧
  15. Bootstrap --》Bootstrap的安装与使用
  16. 线性代数笔记3.2向量间的线性关系(二)
  17. 辽宁中职升高职计算机考试,2021年_辽宁省_中职升高职高考真题
  18. 826. Most Profit Assigning Work
  19. Java基础练习:用户在控制台输入一个年份,判断该年份是平年还是闰年
  20. ac1900修改代理服务器,AC1900路由器怎么设置? | 192路由网

热门文章

  1. Android -- 背景虚化
  2. springMVC对简单对象、Set、List、Map的数据绑定和常见问题(三)
  3. [Javascript]js判断是否为undefined类型
  4. Python:通过执行100万次打印来比较C和python的性能,以及用C和python结合来解决性能问题的方法 ....
  5. 三-(七) 视图(2020-4-3 )
  6. 数据结构——第九章 查找
  7. 下个一个语音,计算机.,中国计算机产业的下一个亮点——汉语语音合成的实用化...
  8. 网评计算机学校好,网评十大最痛苦专业:计算机、数学上榜
  9. 定时器_定时器设计的门铃
  10. ARM开发7.3.4 基础实训( 4 ) 矩阵式键盘的输入系统设计--LPC21XX