Pyramidal Person Re-IDentification via Multi-Loss Dynamic Training
当前的问题及概述
大多数现有的方法高度依赖bounding box,然而,由于实际场景的限制,目前的检测模型往往产生不准确的bounding box,进而避免了算法的性能。
本文提出了一种新的由粗到细的金字塔模型,该模型不仅融合了局部信息和全局信息,而且还强化了局部信息和全局信息之间的线索,避免了bounding box的不准确性带来的影响。可以从下图看到,由于bounding box的遮挡问题,可以将图片进行不等分的划分,在下图从local到global的过程中,少量的局部视图(左)不能很好地匹配,而那些全局视图(右)有更多相似的线索。

模型及loss
2.1Coarse-to-Fine Pyramidal Model :

首先由backbone提取输入图像的feature map(C×H×W),再将feature map按照空间高度轴分为n个部分(C×(H/n)×w),本文n=6,金子特最底层(l=1)为n个部分,最顶层(l=n)为feature map M,其余层数见图2,也可以定义为(类似PCB模型):

对于金字塔P中的每个分支P{l, k},首先分别进行GMP和GAP后将这两个变量相加,形成具有相同编码通道大小的向量,后经过BN层和ReLU减少维数形成特征向量,表示为:x(l, k) = BO(P{l, k}),再输出给全连接层采用softmax loss作为ID loss进行分类:

同时通过triplet loss区分差异较大的部分,缩短差异较小的部分:

具体见图3:

本文采用动态训练策略,具体训练方式略。
实验
数据集:Market-1501 , DukeMTMC-reID , CUHK03
不同网络比较:

消融实验:

其中,“0”表示不使用金字塔的相应级别,而“1”表示使用金字塔的相应级别。“Feature-64”表示每个分支的特征的维数为64。
总结
面对单模态ReID的遮挡问题,目前常用的bounding box方法并不适用,本文提出由粗到细的金字塔结构以提取图像从local到global的特征,在通过feature map经金字塔结构提取到的特征通道后,经过GAP和GMP相加后输入给BN、ReLU得到不同粗细的特征,通过triplet loss进一步区分正样本和负样本,在输入给全连接层,通过softmax loss进行ID分类。

2018 CVPR:Pyramidal Person Re-IDentification via Multi-Loss Dynamic Training相关推荐

  1. CVPR 2018摘要:第五部分​

    转自:http://ai.yanxishe.com/page/TextTranslation/1241 英文原文:What's In a Face (CVPR in Review V) 标签: 图像描 ...

  2. CVPR 2018摘要:第五部分

    标题 What's In a Face (CVPR in Review V) CVPR 2018摘要:第五部分​ by 啦啦啦2 01 What's In a Face (CVPR in Review ...

  3. 【论文阅读】[CVPR 2018] PU-Net: Point Cloud Upsampling Network. [tensorflow] [rec. oth.]

    文章目录 [论文阅读][CVPR 2018] PU-Net: Point Cloud Upsampling Network. [tensorflow] [rec. oth.]

  4. CVPR 2018摘要:第一部分

    原文链接:CVPR GAN部分 本文为 AI 研习社编译的技术博客,原标题 :NeuroNuggets: CVPR 2018 in Review, Part I作者 | Sergey Nikolenk ...

  5. 【医学+深度论文:F25】2018 CVPR Enhanced Optic Disk and Cup Segmentation with Glaucoma Screening from Fundus

    25 2018 CVPR Enhanced Optic Disk and Cup Segmentation with Glaucoma Screening from Fundus Images usi ...

  6. 【医学+深度论文:F34】2018 CVPR Retinal Optic Disc Segmentation using Conditional Generative Adversarial

    34 2018 CVPR Retinal Optic Disc Segmentation using Conditional Generative Adversarial Network datase ...

  7. 2018 CVPR GAN 相关论文调研 (自己分了下类,附地址哦)

    2018 CVPR GAN 相关论文调研 风格迁移 1. PairedCycleGAN: Asymmetric Style Transfer for Applying and Removing Mak ...

  8. 2018 CVPR GAN 相关论文调研

    2018 CVPR GAN 相关论文调研 风格迁移 1. PairedCycleGAN: Asymmetric Style Transfer for Applying and Removing Mak ...

  9. 中国移动互联网2018年度报告:八大关键词总结与十大趋势

    中国移动互联网2018年度报告:八大关键词总结与十大趋势 2019年1月22日,中国商业智能服务商QuestMobile发布<中国移动互联网2018年度大报告>.在这份报告中,QuestM ...

  10. ssh连接出现:WARNING: REMOTE HOST IDENTIFICATION HAS CHANGED!

    ssh连接出现:WARNING: REMOTE HOST IDENTIFICATION HAS CHANGED! 前言 具体 1.我先安装了第一台容器,并修改了ssh的配置文件 2.容器开启服务,宿主 ...

最新文章

  1. Clang:LLVM 的 C 语言家族前端
  2. MySQL数据库中的索引
  3. ubuntu 10.04 常用 设置
  4. Django 学习第十一天——中间键和上下文处理器
  5. PngEncoder_CreateInstance Failed writing PNG because unable to find libpng12.so.0
  6. 音视频互动平台--P2P通信技术
  7. 利用cookie的跨域单点登录的简单实现
  8. acer软件保护卡清除工具clear_如何清除 APT 缓存来回收宝贵的磁盘空间 | Linux 中国...
  9. 挖出一个面试刷题的宝藏资源,赶紧收下了~
  10. C++模板之一:函数模板.odt
  11. 74hc595级联c语言程序,74hc595级联程序范例
  12. OSG仿真案例(4)——创建烟雾粒子效果
  13. vuex 在typescript中的写法
  14. 浅析那些带着“主角光环“的泰坦尼克号幸存者(下)
  15. JavaScript 中的事件对象(读书笔记思维导图)
  16. android9 三星 港版,【极光ROM】-【三星S20+(国行/港版/台版/韩版/美版) G986X-高通865】-【V9.0 Android-R-UB6】...
  17. 五款不错的Web前端开发工具,对小白来说完全够用了!
  18. Spring整合JsonRpc
  19. 单因素方差分析(R)
  20. 配置zigbee模块

热门文章

  1. 2013年台式计算机型号,2013cpu天梯图,台式机处理器天梯图
  2. IT学生技术入门值得关注的网站(页)链接
  3. UI——day5.什么是启动页
  4. python统计学课程_Python数据分析(统计分析)视频课程
  5. LSD(线段检测测试文件)
  6. 浮点数float累加误差解决方式总结
  7. 【2021-07-23】JS逆向之雷速体育canvas渲染数据解密
  8. Shopnc之nginx安装
  9. oracle between and 边界查询用法
  10. 根据时间排序(collection.sort())