点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

垃圾分类作为资源回收利用的重要环节之一, 可以有效地提高资源回收利用效率, 进一步减轻环境污染带 来的危害. 随着现代工业逐步智能化, 传统的图像分类算法已经不能满足垃圾分拣设备的要求. 本文提出一种基于 卷积神经网络的垃圾图像分类模型 (Garbage Classification Network, GCNet). 通过构建注意力机制, 模型完成局部 和全局的特征提取, 能够获取到更加完善、有效的特征信息; 同时, 通过特征融合机制, 将不同层级、尺寸的特征进 行融合, 更加有效地利用特征, 避免梯度消失现象. 实验结果证明, GCNet 在相关垃圾分类数据集上取得了优异的 结果, 能够有效地提高垃圾识别精度.

1 引言

垃圾回收利用作为发展循环经济的必经之路, 是 根治污染、提高环境治理效果的关键所在. 随着我国 生产力水平的发展, 生活垃圾、工业垃圾数量不断增 加, 困扰着很多城市. 据统计, 仅 2018 年, 中国垃圾的 清运量已经达到了 2.28 亿吨[1] . 在人们将垃圾投放进垃圾箱之后, 垃圾被运送到垃圾处理厂统一处理. 当前 国内的垃圾处理厂, 更多依靠人工在流水线上作业去 分拣垃圾, 对作业者健康不利且分拣效率较低, 已不能 满足大量垃圾处理需求. 此外, 人工分拣的垃圾种类极 为有限, 大部分垃圾无法重新回收利用, 造成很大浪费. 随着深度学习技术的发展, 卷积神经网络使图像分类 算法在精度和速度上得到了巨大的提升, 让我们看到 了借助视觉技术自动分拣垃圾的可能性. 通过摄像头 拍摄垃圾图片, 利用卷积神经网络检测出垃圾的类别, 之后就可以借助机械手或推板自动完成分拣任务, 可 以降低人工成本, 提高分拣效率. 因此, 开展垃圾图像 分类算法的研究, 具有重要的应用价值.

2 相关工作

早期, 学者们只能借助经典的图像分类算法[2–5] 完 成垃圾图像分类任务, 这要通过手动提取的图像特征 并结合相应的分类器完成. 吴健等[6] 利用颜色和纹理 特征, 初步完成了废物垃圾识别. 由于不同数据集的图 像背景、尺寸、质量不尽相同, 传统算法需要根据相 应数据人工提取不同的特征, 算法的鲁棒性较差, 并且 处理方式复杂, 所需时间较长, 无法达到实时的效果. 随着卷积神经网络 (Convolution Neural Network, CNN) 的飞速发展, 深度学习广泛应用于图像识别领 域. 作为数据驱动的算法, CNN 具有强大的特征拟合 能力, 可以有效、自动地提取图像特征, 并具有较快的 运行速度. 2012 年, AlexNet[7] 取得了 ImageNet 图像分 类竞赛的冠军, 标志着深度学习的崛起. 随后几年, GoogleNet[8]、VGGNet[9]、ResNet[10] 等算法提升了图 像分类的精度, 并成功应用于人脸识别、车辆检测等 多个领域. 垃圾图像分类, 在深度学习算法的帮助下同 样取得了较大的突破. 斯坦福大学的 Yang 等建立了 TrashNet Dataset 公开数据集, 包含 6 个类别, 共计 2527 张图片. Ozkaya 等[11] 通过对比不同 CNN 网络的 分类能力, 搭建神经网络 (本文称之为 TrashNet) 并进 行参数微调, 在数据集 TrashNet Dataset 上取得了 97.86% 的准确率, 是目前这一数据集上最佳分类网络. 在非公 开数据集方面, Mittal 等[12] 自制了 2561 张的垃圾图片 数据集 GINI, 使用 GarbNet 模型, 得到了 87.69% 的准 确率. 国内方面, 郑海龙等[13] 用 SVM 方法进行了建筑 垃圾分类方面的研究. 向伟等[14] 使用分类网络 CaffeNet, 调整卷积核尺寸和网络深度, 使其适用于水面垃圾分 类, 在其自制的 1500 张图片数据集上取得了 95.75% 的识别率. 2019 年, 华为举办垃圾图像分类竞赛, 构建 了样本容量为一万余张的数据集, 进一步促进了该领 域的发展. 我国各地区生活垃圾分类标准有所不同, 大致可 分为可回收垃圾、有害垃圾、厨余垃圾和其他垃圾这 4 大类, 且每个类别下又包含若干子类别, 种类繁多且 十分复杂. 按照这样的分类标准做的垃圾图像识别研 究, 国内目前还处于起步阶段. 现有的图形分类算法在 垃圾处理领域的应用较少, 且存在准确率不足、泛化 性能差、处理效率低的缺点. 针对现有方法的不足, 本 文提出一种基于卷积神经网络的垃圾图像分类算法 (Garbage Classification Net, GCNet), 在网络结构中融合 了注意力机制模块与特征融合模块, 提高了模型在垃 圾分类任务上的准确性与鲁棒性.

3 算法设计

3.1 模型结构

本文构建的 GCNet 模型包括特征提取器、分类 器两部分, 整体结构如图 1 所示. 图中特征提取器由 Resnet101 作为主干部分, 共包括 5 个 bottleneck, 并在 不同的 bottleneck 后加入注意力机制模块, 同时对不同 模块提取到的特征进行特征融合 (如图 1 中虚线所示) 以从输入 中提取图像的特征信息 :

其中, Me表示特征提取器. F1 yi 分类器由两层全连接层和一个 Softmax 分类器组 成, 对提取到的特征信息 进行分类, 以得到图像在每 个类别下的最终得分 :

其中, Mc表示分类器.

3.2 注意力机制 

注意力机制源于对人类视觉的研究, 人类会根据 实际需要选择视网膜内特定区域进行集中关注, 可以 将有限的处理资源分配至重要的部分. 由于相同类别 垃圾的特征表征差异性可能较大, 不利于图片的正确 分类, 这就要求准确地关注图像中的显著区域. 受这一 思想的启发, 通过构建注意力机制模块, 使网络模型重 点关注有利于分类的特征区域, 以实现更好的特征提 取功能, 其具体结构如图 2 所示.

5 结论

本文针对垃圾图像分类问题, 构建了一种基于卷 积神经网络的算法 GCNet, 该网络通过构建注意力机 制和特征融合机制, 能够有效地提取图像特征、降低 类别差异性带来的影响, 并在相关数据集上取得了 96.73% 的平均准确率, 相较于现有的分类算法提升了 约 4% 的准确率, 满足了实际的应用需求, 具有良好的 应用前景.

 End 

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲

在「小白学视觉」公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~

基于卷积神经网络的垃圾图像分类算法相关推荐

  1. 【洞幺邦】基于卷积神经网络的垃圾图像分类识别

    摘要:随着社会的飞速发展,生活中产生的消耗废品日益剧增,如何更好地分类与回收这些"垃圾"已经成为了急需解决的问题.为了我国能够更好更快的建立健全城市垃圾分类处理制度以及方便人们对于 ...

  2. 基于卷积神经网络的目标检测算法

    基于卷积神经网络的目标检测算法 1 滑窗法 滑窗法的思路及其简单,首先需要已经训练好的一个分类器,然后把图片按照一定间隔和不同的大小分成一个个窗口,在这些窗口上执行分类器.如果得到较高的分数分类,就认 ...

  3. 基于卷积神经网络的人脸识别算法

    摘要:近年来,随着科学技术的不断发展,人脸识别技术日渐成熟,使得人脸识别技术的使用率不断增大.例如:门禁.ATM机.公安系统以及新兴起的人机交互等领域,都应用到了人脸识别系统.在人脸识别研究领域中,深 ...

  4. 基于卷积神经网络的乳腺癌图像分类

    摘要: 乳腺癌是世界范围内癌症死亡的主要原因之一.用苏木精和伊红染色图像对活检组织进行诊断并非易事,专家通常不同意最终诊断.计算机辅助诊断系统有助于降低成本,提高诊断效率.传统的分类方法依赖于针对基于 ...

  5. 基于卷积神经网络的高光谱图像分类

    文章目录 引言 1. 基于光谱特征 2. 基于空间特征 3. 基于空谱特征 3.1 空间特征和光谱特征的融合 3.2 基于3D-CNN分类 4. 总结 引言 近年来深度学习的技术在计算机视觉领域中大放 ...

  6. 基于卷积神经网络的匹配代价算法

    1.问题分析 立体匹配问题,即根据双目摄像头拍摄到的参考图像和目标图像,确定参考图像上每个点在目标图像上对应位置的一个过程.一般展示效果通过输出视差灰度图或伪彩色图像表示实际物体远近程度.直观上人眼可 ...

  7. 基于卷积神经网络的多目标图像检测研究(四)

    第4章 Faster R-CNN网络模型设计 4.1 Faster RCN文件结构介绍 本文在介绍具体的训练模型之前,先介绍Faster RCNN的文件结构.如图4.1所示,主要包括了7个文件夹和4个 ...

  8. 基于卷积神经网络的吸烟行为图像分类

    (1) 基于深度学习的图像分类基本步骤 第1步.通过一定的技术采集图像,对图像进行消噪.归一化.增强等预处理,以增强图像质量; 第2步.采用二维小波变换对增强后图像进行细化处理,将低频系数作为图像分类 ...

  9. 全图表征学习算法之无监督学习和基于卷积神经网络的监督学习

    https://www.toutiao.com/a6640000238176174600/ 2018-12-28 19:12:09 已有的全图表征学习算法包括无监督和有监督两类,其中有监督算法又可以分 ...

最新文章

  1. 开源点云实时压缩方案测试
  2. [Bzoj4408]神秘数(主席树)
  3. nova-scheduler详解 openstack-ice版
  4. Linux系统下用python写程序,用Python写个Linux系统命令
  5. java 爬虫 保存cookies_写爬虫,免不了要研究JavaScript设置cookies的问题
  6. mac下server开发环境配置
  7. matlab 层次聚类
  8. verilog之状态机详细解释(二)
  9. css table布局大法,解决你大部分居中、多列等高、左右布局的问题
  10. 快递员凌晨送件,将下班程序员误认成小偷
  11. Java入门——(5)Java API
  12. java给xyz大小排序_Java Collection - 002 排序
  13. STM32压力传感器信号采集- C#上位机 波形显示
  14. 结构体里数组的初始化
  15. qq企业邮箱登录服务器,腾讯邮箱登录入口(腾讯企业邮箱免费用户申请)
  16. Unity-动画机学习
  17. python右对齐输出乘法表_python打印输出九九乘法表
  18. 2022年自考专业考试(英语)英语翻译练习题
  19. Google软件测试之道
  20. 数据仓库介绍:什么是数据仓库、数据仓库功能、数据仓库价值、数仓领域职业发展方向规划

热门文章

  1. 如何用Python实现超级玛丽的人物行走和碰撞检测?
  2. 一行Python代码能实现这么多丧心病狂的功能?(代码可复制)
  3. AI+DevOps正当时
  4. 这可能是最全的机器学习工具手册!
  5. 聊天机器人落地及进阶实战 | 公开课速记
  6. 再见Python!Yann LeCun警告:深度学习需要新编程语言
  7. 一键fxxk,代码修复神器拯救你
  8. 记一次性能优化,单台4核8G机器支撑5万QPS
  9. Spring Boot 整合 Spring Security 示例
  10. Spring Boot + redis解决商品秒杀库存超卖,看这篇文章就够了