点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

对于处理新的视觉任务,则需要额外的数据集,这需要花费大量精力。本文提出了一种域自适应的新方法,该方法可以比创建附加数据集更轻松地合并多个模型。该方法使用glue层和生成模型合并了不同领域中的预训练模型,该模型提供了潜在特征来训练glue层而无需其他数据集。我们还提出了从预先训练的模型中通过知识蒸馏创建的生成模型。它还允许重用数据集来创建潜在特征以训练胶合层。我们将此方法应用于弱光条件下的目标检测。“Dark YOLO”包含两个模型,“学习如何在黑暗中看”和YOLO。与其它方法相比,“Dark YOLO”花费更少的计算资源。

1、简介

在光线弱的情况下进行视觉任务是一个比较困难的课题。Short-Exposure图像没有足够的特征进行视觉处理,而图像的亮度增强会引起噪声进而影响视觉任务。相比之下,Long-Exposure图像也含有噪声,由于运动模糊而影响视觉任务。
前人一些工作可以总结为以下三点:

  • 1、通过制作附加数据集(比如说the See-in-the-Dark dataset)的方式来缓解这个问题,让数据集中尽可能的包含多种Exposure情况下的图像,但是带来的弊端就是,需要多余的人力来解决,同时不是一个end to end的模型。

  • 2、通过知识蒸馏的方式解决这个问题,相对于构造附加数据集的方式而言是个更好的处理方式;

  • 3、使用无监督学习的方式来学习Domain Gap,进而学到Domain Adaption特性,进而提升在不同Domain之间的适应性,方便Domain的迁移。

2、本文方法

本文主要还是基于前面提到的知识蒸馏的方法进行的设计,提出了YOLO in the Dark模型。

图2 使用领域适应方法融合了在Domain A和Domain B训练的2个模型

这里model A从一个RAW图片中预测一个RGB图片,然后model B从RGB图像中预测目标的位置和类别,完成model A和B的训练后,以潜在特征A和B的边界提取模型fragments。new model由model A和B的以潜在特征A和B的边界提取模型fragments通过一层粘合层(Glue Layer)组合而成。

Glue Layer层可以将模型fragments中的latent feature A转换为latent feature B。SID模型在低光图像上有比较好的效果,因此对model A使用SID模型。还使用目标检测模型YOLO对于model B。

2.1、Domain Adaption的生成模型

通过图2也可以看出来训练Gule Layer需要Domain A+B的数据,然而制作一个这样的数据集需要很大的功夫,所以作者在这里选择了知识蒸馏的方法来定义一个生成模型进而来训练Gule Layer

图3 知识蒸馏方案.红色模块G2e是Student Model

图3 解释了知识蒸馏的方案,其中的生成模型输出的latent feature A来自于,SID模型是编解码的结构,因此生成模型可以作为解码器的映射函数;同时作为Teacher Model同时使用来自SID数据集和模型的数据样本对来训练Student Model

使用RGB数据和通过构造的伪RGB数据训练模型的损失函数loss为:

同时在训练的过程中还定义了Latent Feature(LF) 和LF G1e:

这两个损失函数帮助定义G2e为G1d的逆函数:

图4显示的Gule Laye的Latent Feature SID编码器

(a)是SID网络结构(基于UNet)。SID编码器具有与4层特征相对应的池化scales、、和。

(b)为Gule Laye结构。由pool、cat、Conv和BN组成。pool和cat函数有助于收集latent feature。Conv和BN帮助Domain B转换一个新的latent feature。

图5显示了使用SID编码器的潜在特性重新构建的RGB图像。(a)展示了使用所有特性重构的图像。这些图像的峰值信噪比(PSNR)为31.81,具有结构特征相对于原始图像的相似性(SSIM)为0.752。(b)、(c)和(d)为使用较少特征重建的图像,去除了高空间频率信息。这些图象的质量比图象(a)的质量差。但是为了检测物体,必须识别出物体的具体形状,因此文章决定使用所有的Latent Feature用于Gule Layer。

图 6 可以看出SID模型生成的RGB图像和组合的RGB图像时非常相近的。

同时为了进一步的优化G2e模型,文章还使用YOLO的分类输出特征向量来优化G2e,以提升其转换Domain A->B的性能,具体就是使用余弦相似度来计算向量之间的损失,最后通过反向传播进行更新迭代和优化:

2.2、Training environment

图7(a)显示了环境的完整视图,其中点边界显示了用于训练新模型的部分,其中Gule Layer是模型训练的目标;而训练该模块使用的RGB图像数据即是G2e编码器通过知识蒸馏的方法得到的。整体的训练环境还是基于原生的YOLO模型,使用和G2e编码器一样的RGB数据,这里使用的是COCO数据集进行训练。

在训练期间Gule Layer层会被多个损失函数同时约束,第一个损失函数就是原始YOLO的损失函数;其他的损失函数都是基于原始YOLO模型的Latent Feature A与YOLO in Dark中的Latent Feature B之间的差异得到:

总的损失函数为:

其中即为原生YOLO的损失函数。

图7(b)显示了验证期间的数据流。验证使用与训练相同的路径,后者使用RGB数据并评估来自数据集的足够样本,以确认Gule Layer的行为是正确的。

图7(c)显示了预测期间的数据流。预测使用另一条路径,使用通过编码器G1e从SID模型传输的原始数据。这一阶段是为了评估所提出的黑暗中模型,该模型将改进短曝光原始图像中的目标检测。

3、实验结果

图8显示了SID数据集的对象检测结果。图8(a)是原始YOLO模型使用亮度增强的RGB图像得到的检测结果。RGB图像的亮度增强使得原始YOLO模型更容易检测到目标。因此原始的YOLO模型可以很好地检测图像中的对象。但是,该模型无法检测到图像中的目标。这是因为亮度增强增加了噪音,影响了模型的推断。而本文提出的方法可以直接检测RAW图像中的目标。检测结果如图b1和b2所示。图像c1和c2是标签,标签是通过原始YOLO模型使用SID ground truth(长曝光)图像检测得到。在图像b1中,提出的模型表现得和原始的YOLO模型(图像a1)一样好。此外,所提出的模型可以检测图像b2中的目标。

References

[1] YOLO in the Dark - Domain Adaptation Method for Merging Multiple Models

本文仅做学术分享,如有侵权,请联系删文。

下载1

在「3D视觉工坊」公众号后台回复:3D视觉即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

下载2

在「3D视觉工坊」公众号后台回复:3D视觉github资源汇总即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。

下载3

在「3D视觉工坊」公众号后台回复:相机标定即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配即可下载独家立体匹配学习课件与视频网址。

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、可答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

YOLO窥见黑夜|YOLO in the Dark让黑夜里的目标检测成为可能相关推荐

  1. 黑暗中的YOLO:解决黑夜里的目标检测 | ECCV 2020

    ​​​​​​黑暗中的YOLO:解决黑夜里的目标检测 | ECCV 2020 - 腾讯云开发者社区-腾讯云 (tencent.com) 明天看这个论文... [1] YOLO in the Dark - ...

  2. 【目标检测】54、YOLO v7 | 又是 Alexey AB 大神!专为实时目标检测设计

    文章目录 一.背景 二.方法 2.1 结构 2.2 Trainable bag-of-freebies 三.效果 论文:YOLOv7: Trainable bag-of-freebies sets n ...

  3. 目标检测YOLO实战应用案例100讲-基于深度学习的显著性目标检测研究与应用(论文篇)

    目录 基于深度学习的显著性目标检测综述 基于深度学习的显著性目标检测分类及难点分析

  4. 目标检测YOLO实战应用案例100讲-基于深度学习的红外目标检测研究与应用

    目录 基于深度学习的红外场景目标检测 基于Transformer的目标检测算法

  5. 目标检测YOLO实战应用案例100讲-基于卷积神经网络的小目标检测算法研究

    目录 基于卷积神经网络的小目标检测算法研究 基于卷积神经网络的小目标检测相关理论 2.1 引言

  6. 目标检测YOLO实战应用案例100讲-基于轻量化神经网络的目标检测算法研究与应用

    目录 基于轻量化深度神经网络的目标检测方法研究 基于深度学习的目标检测方法

  7. 目标检测YOLO实战应用案例100讲-基于深度学习的无人机目标检测算法轻量化研究

    目录 基于深度学习的无人机图像目标检测算法研究 目标检测相关技术理论 2.1 引言

  8. 目标检测YOLO实战应用案例100讲-基于改进的YOLOv4柑橘目标检测算法

    目录 基于改进的YOLOX目标检测算法研究 目标检测相关理论基础 2.1 深度学习 2.2 目标检测

  9. 100种目标检测数据集【voc格式yolo格式json格式coco格式】+YOLO系列算法源码及训练好的模型

    提示:本文介绍并分享了应用于各行业.各领域非常有用的目标检测数据集(感谢您的关注+三连,数据集持续更新中-),其中绝大部分数据集作者已应用于各种实际落地项目,数据集整体质量好,标注精确,数据的多样性充 ...

最新文章

  1. R语言回归模型协方差分析(Analysis of Covariance)
  2. 01-从零开始学习VTK
  3. springboot aop + logback + 统一异常处理 打印日志
  4. python开发的系统有哪些_Python web开发=几个模板系统的性能对比
  5. 决策树 算法原理及代码
  6. 听说你是程序员的,给我做个网站呗
  7. 来来来!docker-composeup很慢
  8. linux定时备份文件到指定文件夹,Linux定时备份数据库到指定邮箱的方法
  9. springboot mybatis优雅的添加多数据源
  10. 最大似然估计 高斯分布 正态分布
  11. smartforms 黑底白字的标签logo制作
  12. c语言求解线性方程组ax=b,用C语言求解N阶线性矩阵方程Ax=b的简单解法
  13. 数据库课程设计——学生宿舍信息管理系统
  14. Apache Ambari介绍
  15. 高德地图报错USERKEY_PLAT_NOMATCH解决办法 + 通过经纬度获取当前位置
  16. 数据结构与算法较好的视频
  17. 安卓10不支持qmc解码_鸿图之下iOS和安卓互通吗-10月21日不删档测试服务器规则介绍...
  18. 利用机器学习方法对猪肉价格预测
  19. git本地分支与远程分支绑定关系并强推代码
  20. 改变思维永远比一味盲干更有用,我们该如何白手起家做到财富自由

热门文章

  1. 【Web】Rest API 验证授权如何做?
  2. 接口级故障的应对方法
  3. 【面试题】如何设计一个高并发的系统?
  4. 全民K歌推荐后台架构
  5. 搞 Java 怎么达到年薪 50w ?我的一些想法和经历
  6. 美团(Leaf)分布式ID生成器,好用的一批!
  7. 从 MySQL 执行原理告诉你:为什么分页场景下,请求速度非常慢?
  8. 达达O2O后台架构演进实践:从0到4000高并发请求背后的努力!
  9. 为什么你看了那么多面经,面试还是挂了?
  10. 你写的代码好像一条虫啊!