点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

小白导读

论文是学术研究的精华和未来发展的明灯。小白决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容。个人能力有限,理解难免出现偏差,建议对文章内容感兴趣的读者,一定要下载原文,了解具体内容。

摘要

跨模式人员再识别(Re-ID)是现代视频监控系统的关键。关键的挑战是根据为一个人呈现的语义信息来对齐通道间表示,而忽略背景信息。在这项工作中,作者提出了一种新的基于CNN的结构AXM-Net,旨在学习语义对齐的视觉和文本表示。底层的构建块由多个来自视觉和文本形式的特征地图流和一个新的可学习的上下文共享语义对齐网络组成。作者还提出了互补的模内注意学习机制,以关注特征中更细粒度的局部细节,以及用于鲁棒特征匹配的跨模态亲和损失。作者的设计在从数据中隐式学习特征对齐的能力上是独一无二的。整个AXM-Net可以以端到端的方式进行培训。作者报告人员搜索和跨模式重新识别任务的结果。广泛的实验验证了所提出的框架,并通过显著地优于当前最先进的方法来证明其优越性。

论文创新点

这篇论文的主要思想是将人的视觉和文本特征结合起来,以实现无缝的跨模式或多模式搜索。为了实现这一点,作者提出了AXM-Net,一种基于卷积神经网络(CNN)的新型架构,旨在应对上述挑战,并能够学习语义对齐的跨模态特征表示。该模型的基础构件包括从视觉和文本网络中获取可变数量的局部上下文的特征地图流和基于两种模式的关键线索学习的新的上下文共享语义对齐网络。因此,根据融合的信息参与输出特征映射。上下文共享语义对齐网络利用多尺度、多上下文的模内和模间语义信息,对信息通道进行提升,抑制含有噪声/背景信息的通道。

作者的主要贡献如下:

  • 提出了自适应跨模态上下文共享语义对齐块(AXM-Block),用于捕获上下文感知的共享语义概念,抑制视觉模态和文本模态之间的噪声信息。据作者所知,这是第一个在人的再id设置中跨模式使用内隐语义对齐的工作。

  • 作者提出了有效的模内注意机制,以提取基于局部空间区域的视觉表示细节,同时利用半全局上下文共享和学习文本短语之间的相互依赖。

  • 作者设计了一个跨模态亲和损失模型,该模型基于对齐特征之间的相似性对学习网络进行奖励和惩罚。

  • 大量的实验表明,提出的AXM-Net优于香港中文大学pedes基准上的最先进的(SOTA)人员搜索模型,以及CrossRe-ID和香港中文大学sysu上的跨模式Re-ID。作者还针对著名的Market-1501数据提出了一种跨模态协议。

框架结构

自适应跨模态上下文共享语义对齐(AXM)块

作者的跨模态AXM-Net的图示,它生成全局视觉特征VG,基于局部空间部分的视觉特征VP和文本特征T。用每个视觉特征的文本特征对匹配损失进行成对训练。

注意对视觉特征的局部特征学习

对文本特征的非局部注意

实验结果

AXM-Net的注意力地图可视化。所提出的网络聚焦于歧视信息和拒绝背景。

结论

在这篇论文中,作者提出了一个新的AXM-Net模型来解决跨模式的人员再识别和搜索问题。作者的创新涉及到来自视觉和文本模式和局部模态内关注的特征的上下文对齐。与现有的方法相比,本文提出的AXM-Net是第一个基于卷积特征学习块、axm -块和跨模态特征的隐语义对齐的框架。语境注意力是通过AXM-block内的共享可学习网络来学习的。实验结果表明,作者的网络在香港中文大学- pedes基准测试中定义了新的SOTA性能,同时也证明了作者所提出的网络在跨模式的重新身份识别应用中的潜力

论文链接:https://arxiv.org/pdf/2101.08238.pdf

每日坚持论文分享不易,如果喜欢我们的内容,希望可以推荐或者转发给周围的同学。

- END -

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目31讲

在「小白学视觉」公众号后台回复:Python视觉实战项目31讲即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~

AXM-Net:用于行人检测的跨模式上下文注意力网络相关推荐

  1. 论文翻译 SGCN:Sparse Graph Convolution Network for Pedestrian Trajectory Prediction 用于行人轨迹预测的稀疏图卷积网络

    SGCN:Sparse Graph Convolution Network for Pedestrian Trajectory Prediction 用于行人轨迹预测的稀疏图卷积网络 行人轨迹预测是自 ...

  2. PGA-Net:基于金字塔特征融合与全局上下文注意力网络的自动表面缺陷检测

    1.摘  要 缺陷检测是工业产品处理中的一项重要任务.当前,已经有很多基于计算机视觉技术的检测方法成功应用于工业领域并取得了较好的检测结果.然而,受限于类间表面缺陷的内在复杂性,使得实现完全自动的缺陷 ...

  3. BCPNet:用于实时语义分割的双向上下文传播网络

    论文地址:https://arxiv.org/pdf/2005.11034.pdf 代码地址:暂无 空间细节和上下文相关性是语义分割的两类关键信息.一般来说,空间细节最可能存在于浅层,而上下文关联最可 ...

  4. 目标检测算法SSD用于行人检测(二):训练和测试SSD网络

    将Caltech数据集转化为caffe的输入数据格式LMDB请参考上一篇文章:https://blog.csdn.net/sunshine_zkf/article/details/86173247 前 ...

  5. 信号检测与估计理论 pdf_CVPR2020|行人检测与重识算法推荐论文源码大盘点

    本文收集了CVPR 2020 一些行人检测与人员重识别优秀论文,我们知道在视频监控相关领域这些技术方向可以得到很好得广泛应用. 行人检测及人群计数从内容来看主要解决行人与行人.行人与物体间的遮挡透视, ...

  6. 行人检测 读书笔记 综述

    行人检测 读书笔记 综述(1) 朱文佳-基于机器学习的行人检测关键技术研究 本文是博主对上海交通大学的朱文佳的硕士毕业论文的学习笔记,如果不当或理解错误之处,敬请指导,不胜感激. 绪论 1.1 典型应 ...

  7. 转:行人检测(Pedestrian Detection)资源

    .论文 CVPR 2012 与行人检测相关的论文 [1] Contextual Boost for Pedestrian Detection  YuanyuanDing, Jing Xiao [2]  ...

  8. 【论文学习】行人检测——CVPR:通过MIMS在低分辨率图像中做行人检测

    论文:Pedestrian Detection in Low-resolution Imagery by Learning Multi-scale Intrinsic Motion Structure ...

  9. 【SIGAI综述】行人检测算法

    其它机器学习.深度学习算法的全面系统讲解可以阅读<机器学习-原理.算法与应用>,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造. 书的购买链接 书的勘误,优化,源代码资源 本文为S ...

最新文章

  1. 经典!工业界深度推荐系统与CTR预估必读的论文汇总
  2. jsp点击按钮弹出输入框_按键精灵UI界面的输入框原来是这样使用的
  3. 正则表达式的汉字匹配
  4. C#中的Invoke和BeginInvoke
  5. 50. 熟悉与STL相关的Web站点
  6. 中文命名实体识别总结
  7. 关于计算机英语手抄报全国一等奖,获奖手抄报图片
  8. linux安装seaweedfs
  9. 医院挂号系统代码_智慧医院中心是怎样做的?分诊叫号系统如何正确使用!
  10. CCF GitLink开源编程夏令营 · 学生开放报名!
  11. 用ansible自动化搭建web、sql服务器、lvs调度器
  12. 软件企业双软认证的条件和好处是什么
  13. seleniumxpath打码平台
  14. JVM 内存模型面试题目
  15. CTPN windows下实现
  16. 微信(电脑版)多开教程
  17. 判断是否为USD格式
  18. iPhone越狱开发环境搭建
  19. C/C++系列之如何实现一个avi格式的播放器
  20. 大佬教你们如何快速复制网页中的链接地址(技巧分享,非爬虫篇)

热门文章

  1. AI时代,谈数据分析时我们要谈些什么?
  2. NIPS论文排行榜出炉,南大周志华5篇论文入选
  3. 无人驾驶急需解决:规划控制和传感器价格高两大问题(附Apollo算法)
  4. MIT与商汤科技成立人工智能联盟
  5. 字符串拼接还在用StringBuilder?快试试Java8中的StringJoiner吧,真香!
  6. 阿里三面让我现场改造Spring框架,明天带他去爬山!
  7. Java接地气日常编码技巧
  8. SpringBoot最最最常用的注解梳理
  9. Redis 性能问题分析(好文推荐)
  10. Java泛型背后是什么?