点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

小黑导读

论文是学术研究的精华和未来发展的明灯。小黑决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容。个人能力有限,理解难免出现偏差,建议对文章内容感兴趣的读者,一定要下载原文,了解具体内容。

摘要

在本文中,作者提出了一种在热域中改进行人检测的方法:首先,使用生成数据增强方法,然后使用生成数据的域自适应方法适应RGB行人检测器。作者的模型,基于最小二乘生成对抗网络,被训练合成输入RGB图像的真实热版本,然后用于增加有限数量的标记热行人图像可供训练。作者应用生成数据增强策略,以适应预训练的YOLOv3行人检测器,以检测仅在热领域。实验结果证明了作者方法的有效性:使用不到50%的实际热训练数据,并在域自适应阶段依靠作者的模型合成的数据,作者的检测器在KAIST多光谱行人检测基准上取得了最先进的结果;即使有更多真实的热数据可用,将GAN生成的图像添加到训练数据中也会提高性能,从而表明这些图像是一种有效的数据增强形式。据作者所知,作者的探测器在KAIST上获得了最先进的单模态检测结果。

论文创新点

这项工作的贡献是:

•作者提出了一种基于最小二乘生成对抗网络(LSGAN)[14]的新生成模型,能够从RGB合成热图像;

•作者提出了一种混合真实/合成训练域自适应程序,使用作者的LSGAN将真实热图像与从未标记的RGB行人图像合成的热图像混合,并使用这个增强训练集来适应YOLOv3[15]检测器;

•作者进行了广泛的消融研究,以探索作者方法的有效性,以及真实图像和合成图像的各种混合比例;

•作者进行了大量的实验,将作者的方法与最先进的方法进行了比较,据作者所知,作者的仅热探测器在KAIST多光谱行人检测基准上比所有最先进的单模检测方法表现得更好。

框架结构

系统概述:vis2therm GAN从可见数据生成假热图像;混合了真实和虚假的热图像以及相关的物体边界盒,用来训练一个物体探测器,然后用热成像相机的图像进行测试。

作者的模型是经过对抗和知觉损失训练的LSGAN。最小二乘GAN (LSGAN),改进了标准GAN模型,将损失函数从交叉熵改变为平方距离。它比较稳定,也比较容易训练。Generator G架构使用残差密集块(RRDB)中的残差作为基本单元构建。与[59]一样,作者从传统的convb - bn - lrelu三元组中去掉批处理规范化层。初始降采样卷积后,)顺序堆叠5个RDDB块。每个RDDB块由4个密集块组成。每个密集块的增长率为k = 32,包含5对连续的卷积层,后面是一个漏泄矫正线性单元(LReLU)。

实验结果

使用80%的真实图像和20%的合成图像训练的检测器检测示例。第一行是有感知损失的检测结果,第二行是没有感知损失的检测结果。蓝框表示真阳性检测,绿框表示假阴性,红框表示假阳性。

韩科院热图像与探测的例子

第一行是白天图像,第二行是夜间图像。第一列和第二列分别为纯合成训练和纯真实训练的检测结果。第三列和最后一列分别是全部和混合90%的比例。蓝框表示真阳性检测,绿框表示假阴性,红框表示假阳性。

结论

本文提出了一种基于LSGAN的新型GAN结构,用于将可见光光谱图像转换成热光谱图像。作者还提出了一种新的训练方法,将真实图像和合成图像混合,以适应YOLOv3探测器在热域的检测。大量的实验验证表明,作者的方法在KAIST数据集上的行人检测方面优于最先进的单模态检测器。作者的实验表明,即使只使用50%可用的真实热图像,也有可能获得与使用100%真实热图像训练的最先进方法相媲美的结果。这表明,使用作者提出的GAN生成的图像是有益的,可能有助于调整可见光谱探测器,使其在缺乏训练数据的领域中运行。

论文链接:https://arxiv.org/pdf/2102.02005.pdf

每日坚持论文分享不易,如果喜欢我们的内容,希望可以推荐或者转发给周围的同学。

本文仅做学术分享,如有侵权,请联系删文。

下载1

在「3D视觉工坊」公众号后台回复:3D视觉即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

下载2

在「3D视觉工坊」公众号后台回复:3D视觉github资源汇总即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。

下载3

在「3D视觉工坊」公众号后台回复:相机标定即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配即可下载独家立体匹配学习课件与视频网址。

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近3000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、可答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

利用合成图像对热图像进行鲁棒行人检测相关推荐

  1. OpenCV—python 图像显著性检测算法—鲁棒背景检测

    文章目录 一.鲁棒背景检测的显著性优化 二.代码演示 一.鲁棒背景检测的显著性优化 Saliency Optimization from Robust Background Detection 摘要 ...

  2. CVPR2020 | 利用NAS搜索针对对抗攻击的鲁棒神经网络结构

    本文介绍CVPR 2020 论文 When NAS Meets Robustness: In Search of Robust Architectures against Adversarial At ...

  3. ICCV2021 Oral SimROD:简单高效的数据增强!华为提出了一种简单的鲁棒目标检测自适应方法...

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨小马 来源丨我爱计算机视觉 ▊ 写在前面 本文提出了一种简单有效的鲁棒目标检测无监督自适应方法( ...

  4. 基于2D-RNN的鲁棒行人跟踪

    基于2D-RNN的鲁棒行人跟踪 Recurrent Neural Networks RNN 行人跟踪 读"G.L. Masala, et.al., 2D Recurrent Neural N ...

  5. 图像特征提取算法:加速鲁棒特征SURF

    1.原理: Sift算法的优点是特征稳定,对旋转.尺度变换.亮度保持不变性,对视角变换.噪声也有一定程度的稳定性:缺点是实时性不高,并且对于边缘光滑目标的特征点提取能力较弱. Surf(Speeded ...

  6. CV:阿里在CV数据增强领域带来SOTA新范式(已被NeurIPS2022接收)—基于离散化对抗训练的鲁棒视觉新基准!

    CV:阿里在CV数据增强领域带来SOTA新范式(已被NeurIPS2022接收)-基于离散化对抗训练的鲁棒视觉新基准! 导读:本文中,来自阿里巴巴AAIG的研究团队在模型鲁棒性问题上进行了研究,包括对 ...

  7. 【NeurIPS2022】阿里提出基于离散化对抗训练的鲁棒视觉新基准

    本文中,来自阿里巴巴AAIG的研究团队在模型鲁棒性问题上进行了研究,包括对抗鲁棒.分布外泛化性等.他们提出了一种即插即用的离散化对抗训练的方法增强视觉表征.该方法在图像分类.目标检测和自监督学习等多个 ...

  8. 【论文摘要】基于多数投票模式和超混沌加密的彩色图像鲁棒安全零水印算法

    Robust and secure zero-watermarking algorithm for color images based on majority voting pattern and ...

  9. 利用Hog特征和SVM分类器进行行人检测

    1.HOG特征: 方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子.它通过计算和统计图像局部区域的 ...

最新文章

  1. 21天mysql_把整个Mysql拆分成21天,轻松掌握,搞定(下)
  2. TCP/IP协议的SYN攻击
  3. hdu 5094 Maze
  4. poj 2513 Colored Sticks
  5. Windows Phone 的后台代理不支持的 API
  6. onvif开发之设备发现功能的实现
  7. 平面直角坐标系中的旋转公式_【数理之路】初中范围推导三角函数倍角正弦公式...
  8. Meta Learning | 加了元学习之后,少样本学习竟然可以变得这么简单!
  9. 设计模式(一)单例模式:1-饿汉模式(Eager)
  10. python汉化之后好用吗_关于Python写的程序汉化心得和所走过的各种坑儿
  11. foobar android 目录,最强手机音乐播放器?Foobar2K安卓版体验
  12. 老外用VB6写的Windows驱动备份软件
  13. iOS开发中Touch ID的使用
  14. 强大的Winform Chart图表控件使用说明
  15. html中seo三大标签,探索者SEO告诉你三大标签如何正确使用
  16. 使用pydot 画CNN网络结构图
  17. 全局变量global的用法
  18. 网络运维系列:二级域名启用与配置
  19. windows无法连接到打印机_“Windows无法连接打印机,操作失败,错误为0x000003e3”...
  20. ubuntu安装mysql-python报错

热门文章

  1. 从CES Asia 2017看智能家居的发展趋势
  2. Odoo小数精度及货币精度详解
  3. MySQL count(*)空表为何会很慢
  4. python 字典排序
  5. MySQL下备份和恢复简单介绍
  6. php HASHTABLE 实现
  7. 且看电脑高手如何优雅的使用windows系统
  8. flash绘图API:绘制植物
  9. Nginx从基本原理到开发实践
  10. 腾讯推出的这款高性能 RPC 开发框架,确定不了解下吗?