原文链接:https://www.sciencedirect.com/science/article/pii/S0925231219318156

目录

摘要

方法

CE loss

Hetero-Center Loss

Two-Stream Local Feature Network

特征提取

特征嵌入

试验

测试

结果


摘要

(1)提出了一种新的损失函数,称为 Hetero-Center loss (HC loss),以减少类内跨模态变化,通过约束两个异质模态之间的类内中心距离来监督网络学习跨模态不变信息。在交叉熵(CE)损失和HC损失的联合监督下,训练网络以尽可能地实现两个重要目标,即类间差异和类内跨模态相似性。

(2)提出了一种称为两流本地特征网络 (TSLFN) 的网络框架,采用水平切块的方式学习局部特征。为了将不同模态的特征投影到同一子空间中,将共享权重的全连接层用于两个分支中的相应条纹。

方法

CE loss

传统的损失函数无法监督网络提取模态共享信息。例如,CE损失函数计算如下:

交叉熵的目标是提取特定于身份的信息进行分类。 但是损失函数并没有约束网络有效地提取模态共享信息以形成特征描述符,因为一些模态特定信息也是引导网络正确预测身份的身份特定信息。

CE 损失监督的典型特征分布:

不同颜色的点表示属于不同身份的特征。 不同形状的点表示从不同模态的图像中提取的特征。 不同形状的红点表示每个身份中不同模态的特征中心。

Hetero-Center Loss

损失函数计算两个模态分布之间的中心距离,来提高类内跨模态相似性。公式如下:

但是每个样本在每次迭代中学习每个类的两个中心,这需要大量且不切实际的计算成本。因此,在一个小批量中而不是在整个训练集中计算每个类的两个模态中心。在每次迭代中,我们从训练集中随机选择 L 个身份。 然后,我们随机选择每个选择的身份的 T 个 RGB 图像和 T 个红外图像组成一个 mini-batch,所以它的大小是 2xLx T=K。由于多次迭代中的随机抽样,小批量中的局部约束与整个训练集中的全局约束具有相同的效果。

HC loss 限制每个类的中心距离以提高类内跨模态相似性 ,CE loss 扩大类间差异。采用了 HC 损失和 CE 损失的联合监督。 整体损失函数为

不同 的特征分布如图:

随着 的增加,不同模态的特征分布被拉得更近,不同模态的两个特征中心之间的距离更小,意味着对于不同的异质图像,学习到的特征表示更一致,网络更倾向于提取模态共享信息以形成特征表示。

Two-Stream Local Feature Network

提出了两流本地特征网络 (TSLFN),其体系结构如图所示:

该网络包含两种模式的两个分支。 在每个分支中,输入图像都进入 Resnet-50 主干。 然后,从主干输出的特征图被传统的平均池化层分成 p 个条带。 对于每个条带,权重共享 FC 层降低了特征的维度。 之后,将降维特征输入到 L2-Norm 层和 FC 层,计算 HC 损失和 CE 损失。 在测试阶段,所有的降维特征被连接起来形成最终的描述符。

特征提取

去掉了Resnet50 中最后的下采样操作,扩大接收的面积,丰富特征的粒度,从主干输出的特征图在水平方向上被均匀地划分为 p 个条带。 每个条纹被平均成一个局部特征向量。 之后,我们采用全连接(FC)层来降低每个局部特征向量的维数。 为了弥合两种模式之间的差距,两个分支中对应的全连接层共享相同的权重。

特征嵌入

监督网络学习特征表示,尽可能扩大类间差异和提高类内跨模态相似度。,我们采用 HC loss 和 CE loss 来监督网络的训练,对于 HC 损失,特征向量在计算损失值之前要经过 L2 归一。对于CE损失,将局部特征向量输入到分类器中,分类器由FC层和softmax激活层组成。 有p个局部特征向量需要输入到具有独立参数的不同分类器中。 然后,分类器分别预测每个特征向量的身份。 对于每个分支,我们根据分类器的预测值和输入图像的身份计算 CE 损失。

试验

测试

训练阶段, 行人图像被调整为 288×144。 随机裁剪和随机水平翻转用于数据增强。 批次大小为 64。为了实现提出的采样策略,批次中的身份数量设置为 4。因此,在批次中,每个身份包含 8 个 RGB 图像和 8 个红外图像。 主干的输出特征图被平均分成 p6= 条带。 第一个 FC 层将特征的维度降低到 512。 因此,最终描述符的维度为 6×512=3072。 为了平衡两个损失函数, 设置为 0.5。 采用带动量的SGD进行优化,其中动量设置为0.9。 我们使用衰减学习率计划。 学习率在前 30 个 epoch 中设置为 1x 10-2,在第 30 个 epoch 后衰减到 1x 10-4。

在测试阶段,测试集中的RGB图像用于gallery set,而红外图像用于probe set。采用两种测试模式,第一种模式是全搜索模式,所有的摄像头都在测试阶段使用。第二种模式是室内搜索,使用放置在室内环境中的摄像机来构建gallery set。对于probe set中的每一幅图像,我们计算红外图像与gallery set中的每一幅RGB图像的特征相似度。

结果

实验结果明显优于其他方法

跨模态行人重识别:Hetero-Center Loss for Cross-Modality Person Re-Identification学习记录笔记相关推荐

  1. 跨模态行人重识别:Discover Cross-Modality Nuances for Visible-Infrared Person Re-Identification学习记录笔记

    目录 摘要 网络结构 具体方法 MAM PAM 模态分类损失 共享特征ID损失 中心簇损失 总损失 试验 注意模式 可视化分布 结果 原文链接:Discover Cross-Modality Nuan ...

  2. 跨模态行人重识别:CM-NAS: Cross-Modality Neural Architecture Searchfor Visible-Infrared Person Re-Iden学习记录笔记

    目录 摘要 方法 试验 论文链接:CM-NAS: Cross-Modality Neural Architecture Search for Visible-Infrared Person Re-Id ...

  3. 跨模态行人重识别:Hetero-Center Loss for Cross-Modality Person Re-Identification

    Hetero-Center Loss for Cross-Modality Person Re-Identification 目录 Hetero-Center Loss for Cross-Modal ...

  4. 跨模态行人重识别:Dynamic Dual-Attentive Aggregation Learningfor Visible-Infrared Person Re-Identification学习笔记

    目录 摘要 方法 模态内加权聚合(IWPA) 跨模态图结构化注意力(CGSA) Graph Construction Graph Attention 动态对偶聚合学习 试验 论文链接:Dynamic ...

  5. 跨模态行人重识别研究综述

    跨模态行人重识别研究综述 刘天瑜,刘正熙 摘要:传统的行人重识别主要工作集中在同一模态下的行人重识别上,大部分应用于光源充足的场景.随着视频安防监控要求的不断提升,为了克服可见光摄像头无法全天候进行使 ...

  6. 跨模态行人重识别:Deep Learning for Person Re-identification:A Survey and Outlook(行人重识别综述)

    Deep Learning for Person Re-identification:A Survey and Outlook(行人重识别综述) 写在前面:感谢叶茫博士对AGW的开源,AGW非常适合刚 ...

  7. 可见光-红外的跨模态行人重识别最新研究成果汇总

    目录 Introduction Challenges Advantages Methods [2020 AAAI] Cross-Modality Paired-Images Generation fo ...

  8. 今日 Paper | 跨模态行人重识别;对抗时尚迁移;学会注意错误等

    2020-03-11 15:11:09 目录 跨模态行人重识别:共享与特异特征变换算法cm-SSFT GarmentGAN:具有图片真实感的对抗时尚迁移 学习将纹理从服装图像转移到3D人体 学会注意错 ...

  9. AAAI 2020 | XIV-ReID:基于X模态的跨模态行人重识别

    ©PaperWeekly 原创 · 作者|张晓涵 学校|西安交通大学本科生 研究方向|计算机视觉/行人重识别 论文标题:Infrared-Visible Cross-Modal Person Re-I ...

最新文章

  1. Python参考书籍
  2. html页面设置document类型,DOM-Document类型
  3. grafana授权公司内部邮箱登录 ldap配置
  4. ssh放行端口_安全组中已经添加规则放行SSH端口的访问之后如何使用f1 RTL
  5. Complex类与运算符重载
  6. IE下打开ClearType后透明字体问题解决
  7. 电子计算机教室宣传标语,电子备课室宣传标语有哪些
  8. Hutool - 身份证验证及其信息解读封装
  9. 给视频加水印的软件有哪些?推荐两种软件快速加水印
  10. 核心对象激发状态的意义
  11. 怎么把手机文件导入华为云服务器,华为手机如何上传数据到云服务器
  12. pc客户端软件自动化测试工具,自动化测试工具(QuickTester)
  13. 6月小红书博主排行,谁是最佳创作者?
  14. Maven聚合和继承
  15. 数据分析案例--2012美国总统竞选赞助数据分析
  16. 这篇博士毕业论文致谢句句诛心……
  17. 前端实现pdf在线预览
  18. 【笔记】css实现文字横向排列/竖向排列
  19. java读取并修改xml文件
  20. 冬季主题调色效果Lr预设

热门文章

  1. hifiasm的使用方法
  2. 乐视三合一体感摄像头标定全过程
  3. 海伯利安:区块链未来的新大陆与新范式
  4. 数据结构第二版(朱昌杰版)树
  5. 双运放仪表放大器 小信号放大
  6. Echarts-仪表盘
  7. 计算机启动后没有桌面,我的电脑开机后桌面上的文件都没有了是什么情况?
  8. 数据分析:预测汽车违约风险
  9. 基于matlab的雷达,基于Matlab的雷达系统仿真
  10. 香港服务器租用数据真的进入了刷脸时代吗