深度学习使用CNN进行图像分类
- 1,图像分类
- 2,类别不平衡问题
- 3,图像分类模型
- 4,提升分类模型精度的方法
- 5,数据扩充(数据增强)
- 6,参考资料
图像分类是计算机视觉中最基础的任务,基本上深度学习模型的发展史就是图像分类任务提升的发展历史,但是图像分类并不是那么简单,也没有被完全解决。
毕设项目演示地址: 链接
毕业项目设计代做项目方向涵盖:
目标检测、语义分割、深度估计、超分辨率、3D目标检测、CNN、GAN、目标跟踪、竞赛解决方案、去模糊、显著性检测、剪枝、活体检测、人脸关键点检测、3D目标跟踪、视频修复、人脸表情识别、时序动作检测、图像检索、异常检测等
1,图像分类
图像分类顾名思义就是一个模式分类问题,它的目标是将不同的图像,划分到不同的类别,实现最小的分类误差。
1,单标签分类:总体来说,对于单标签的图像分类问题,它可以分为**跨物种语义级别的图像分类(cifar10
),子类细粒度图像分类(Caltech-UCSD Birds-200-2011
),以及实例级图像分类(人脸识别
)**三大类别。
虽然基本的图像分类任务,尤其是比赛趋近饱和,但是现实中的图像任务仍然有很多的困难和挑战。如类别不均衡的分类任务,类内方差非常大的细粒度分类任务,以及包含无穷负样本的分类任务。
2,多标签分类:多标签分类问题,通常有两种解决方案,即转换为多个单标签分类问题,或者直接联合研究。前者,可以训练多个分类器,来判断该维度属性的是否,损失函数常使用softmax loss。后者,则直接训练一个多标签的分类器,所使用的标签为0,1,0,0…这样的向量,使用hanmming距离等作为优化目标。
2,类别不平衡问题
在很多情况下,可能会遇到数据不平衡问题。数据不平衡是什么意思呢?举一个简单的例子:假设你正在训练一个网络模型,该模型用来预测视频中是否有人持有致命武器。但是训练数据中只有 50 个持有武器的视频,而有 1000 个没有持有武器的视频。如果使用这个数据集完成训练的话,模型肯定倾向于预测视频中没有持有武器。针对这个问题,可以做一些事情来解决:
- 在损失函数中使用权重:对数据量小的类别在损失函数中添加更高的权重,使得对于该特定类别的任何未正确分类将导致损失函数输出非常高的错误。
- 过采样:重复包含代表性不足类别的一些训练实例有助于提升模型精度。
- 欠采样:对数据量大的类别进行采样,降低二者的不平衡程度。
- 数据扩充:对数据量小的类别进行扩充。
3,图像分类模型
近些年来用于分类(backbone
)的经典 CNN
模型,它们之间计算量和精度关系的变化图如下所示。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-UdGQ7F3d-1664373200424)(…/…/data/images/经典的CNN模型.png)]
4,提升分类模型精度的方法
5,数据扩充(数据增强)
深度学习依赖于大数据,使用更多的数据已被证明可以进一步提升模型的精度。随着扩充的处理,将会免费获得更多的数据,使用的扩充方法取决于具体任务,比如,你在做自动驾驶汽车任务,可能不会有倒置的树、汽车和建筑物,因此对图像进行竖直翻转是没有意义的,然而,当天气变化和整个场景变化时,对图像进行光线变化和水平翻转是有意义的。
6,参考资料
不懂得如何优化CNN图像分类模型?这有一份综合设计指南请供查阅
【技术综述】你真的了解图像分类吗?
深度学习使用CNN进行图像分类相关推荐
- [Python人工智能] 三十.Keras深度学习构建CNN识别阿拉伯手写文字图像
从本专栏开始,作者正式研究Python深度学习.神经网络及人工智能相关知识.前一篇文章分享了生成对抗网络GAN的基础知识,包括什么是GAN.常用算法(CGAN.DCGAN.infoGAN.WGAN). ...
- [Python图像识别] 四十七.Keras深度学习构建CNN识别阿拉伯手写文字图像
该系列文章是讲解Python OpenCV图像处理知识,前期主要讲解图像入门.OpenCV基础用法,中期讲解图像处理的各种算法,包括图像锐化算子.图像增强技术.图像分割等,后期结合深度学习研究图像识别 ...
- 深度学习经典网络解析图像分类篇(二):AlexNet
深度学习经典网络解析图像分类篇(二):AlexNet 1.背景介绍 2.ImageNet 3.AlexNet 3.1AlexNet简介 3.2AlexNet网络架构 3.2.1第一层(CONV1) 3 ...
- 【深度学习】CNN神经网络应用(用于亚洲大黄蜂分类)
[深度学习]CNN神经网络应用(用于亚洲大黄蜂分类) 文章目录 1 概述 2 假设条件 3 网络结构 4 数据集和参数 5 Asian hornet classification experiment ...
- [caffe]深度学习之CNN检测object detection方法摘要介绍
[caffe]深度学习之CNN检测object detection方法摘要介绍 2015-08-17 17:44 3276人阅读 评论(1) 收藏 举报 一两年cnn在检测这块的发展突飞猛进,下面详 ...
- 【Android,Kotlin,TFLite】移动设备集成深度学习轻模型TFlite(图像分类篇)
深度学习.Tensorflow.TFLite.移动设备集成深度学习轻模型TFlite.图像分类篇 Why i create it? 为了创建一个易用且易于集成的TFlite加载库, 所以TFLiteL ...
- 【深度学习前沿应用】图像分类Fine-Tuning
[深度学习前沿应用]图像分类Fine-Tuning 作者简介:在校大学生一枚,华为云享专家,阿里云星级博主,腾云先锋(TDP)成员,云曦智划项目总负责人,全国高等学校计算机教学与产业实践资源建设专家委 ...
- 【深度学习】CNN图像分类:从LeNet5到EfficientNet
深度学习 Author:louwill From:深度学习笔记 在对卷积的含义有了一定的理解之后,我们便可以对CNN在最简单的计算机视觉任务图像分类中的经典网络进行探索.CNN在近几年的发展历程中,从 ...
- 基于深度学习的水下声纳图像分类方法研究
本文是哈尔滨工程大学2018年的一篇硕士论文,作者是焦佳. 摘要 结合水下声纳图像的特点,研究深度学习相关理论与研究方法后,为水下声纳图像的分类构建深度信念网络(Deep Belief Network ...
最新文章
- POJ1258 Agri-Net【最小生成树】
- python【蓝桥杯vip练习题库】ALGO-77 斜率计算
- CentOS6.9中搭建FTP服务器
- 前后端分离项目后端向前端返回压缩包的方法实现java版
- LINUX下的tty,console与串口分析
- Unity面试题精选(5)
- JSP Servlet Mysql高校学生社团管理系统
- Linux 添加环境变量
- python面试题No6
- 又把锅甩给中国!苹果和解给了300多亿,但高通业绩预测并不乐观
- C++基础::非类型模板参数在STL中的应用
- 【知易行难】RS485组网连接示意图
- Ceph:pg peering过程分析
- 贪心 汽车加油 java_贪心算法解汽车加油站问题
- iframe 如何禁止视频自动播放
- 现代软件工程讲义 4 方法论 - MSF
- MIT 6.828 Lab1(从引导扇区开始)
- AI反腐:细查24万份合同,牵出千亿违规采购
- 改变 el-dialog 的宽度
- 奇遇MIX体验:加入全彩VST透视,开创消费级VR一体机新时代
热门文章
- inxni扫地机器人_inxni以内智能扫地机器人APP下载与使用说明
- 总结了近百个Android优秀开源项目,覆盖Android开发的每个领域
- MIPS 架构的 AR9331芯片 编译链相关内容
- 【JS】1347- localStorage 的高阶用法
- 电机可以用到计算机应用吗,电机与控制应用是核心期刊吗_核心期刊_2018中国医学类核心期刊一览表...
- 三星手机丢失了数据怎么找回
- 高速数据采集卡的机理分析
- 解决IDM试用到期还不想使用破解版的方法
- SAP中出具发票凭证清单的应用发现
- linux 软件备份 主从,linux高可用(HA)keepalived 主从备份