Person Re-identification by Local Maximal Occurrence Representation and Metric Learning

  1. 提出了一个特征提取方法LOMO(local maximal occurrence),主要着眼于光照和视角问题。特征提取之前采用Retinex算法进行图像增强。特征表示采用HSV直方图和SILTP直方图
  2. XQDA(Cross-view Quadratic Discriminant Analysis)方法对空间进行降维和距离度量(学习降维矩阵)
  3. 一个降低∑\sum计算复杂度的方法
     文中提到的Retinex算法是一种常见的图像增强算法,假设我们所看到的颜色是由于物体反射红绿蓝三种光形成的,颜色不是由光照强度决定的而是由物体的反射能力决定的(颜色恒常在,不因为光发生变化)。Retinex可以在动态范围压缩、边缘增强和颜色恒常三个方面达到平衡,因此可以对各种不同类型的图像进行自适应的增强。详见http://blog.csdn.net/carson2005/article/details/9502053
     在图像增强之后采用HSV颜色直方图来提取颜色特征,SILTP描述子来提取光照尺度不变的纹理特征,采用滑动窗口来描述局部细节。采用10X10,步长为5的窗口在整张图片中滑动。在每个子窗口中分别统计2个尺度的SILTP直方图和HSV直方图,每个直方图的bin表示该种模式出现的概率,为了弱化行人视角变化问题,对同一模式在同一水平位置的滑动窗口中取最大概率值作为最后的直方图值。
     令Δ=xi−xj\Delta = x_i-x_j表示2个样本之间的特征差异,同类样本之间的差异Δ\Delta符合变量ΩI\Omega_I的高斯分布,异类样本之间的差异Δ\Delta符合变量ΩE\Omega_E的高斯分布,并且均值都为0。KISSME and Bayessian face

    f(Δ)=lnP(Δ|ΩE)P(Δ|ΩI)=ΔT(∑I−1−∑E−1)Δ⇒d(xi,xj)=(xi−xj)T(∑I−1−∑E−1)((xi−xj)

    f(\Delta)=ln\frac{P(\Delta|\Omega_E)}{P(\Delta|\Omega_I)}=\Delta^T({\sum\nolimits_{I}}^{-1}-{\sum\nolimits_{E}}^{-1})\Delta \Rightarrow d(x_i,x_j)={(x_i-x_j)}^T({\sum\nolimits_{I}}^{-1}-{\sum\nolimits_{E}}^{-1})((x_i-x_j)
     表示2个样本之间的距离,大于0,有很大概率是不同类
     由于特征向量太大,需要降维,一般的PCA降维是无监督方法,并没有考虑到距离度量学习。文中采用一个dxr的矩阵W(d是原特征的维度),对距离函数重写为

    f(Δ)=(x−z)TW(∑I′−1−∑E′−1)WT(x−z)

    f(\Delta)={(x-z)}^TW({\sum\nolimits_{I}}^{'-1}-{\sum\nolimits_{E}}^{'-1})W^T(x-z)
     其中x is sample from one view,and z is from other view,∑I′=WT∑EW{\sum\nolimits_{I}}^{'}=W^T{\sum\nolimits_{E}}W,由于2个分布的均值相同,可以通过增大方差的距离来增加区分度,对于矩阵W的列向量w,有σI(w)=wT∑Iw\sigma_I(w)=w^T\sum\nolimits_Iw,因此我们可以定义Generalized Rayleigh Quotient来最大化方差之间的比值

    J(w)=wT∑EwwT∑Iw

    J(w) = \frac{w^T\sum\nolimits_Ew}{w^T\sum\nolimits_Iw}
     此时问题变成maxwwT∑Ew,s.t.wT∑Iw=1\max\limits_ww^T\sum\nolimits_Ew, s.t.w^T\sum\nolimits_Iw=1,将求解W变成一个监督问题,只需要对∑−1I∑E\sum\nolimits_I^{-1}\sum\nolimits_E进行特征值分解,求得前r大的特征向量即组成W。

LOMO+XQDA(2015CVPR)相关推荐

  1. Triplet Loss: A Unified Embedding for Face Recognition and Clustering(论文阅读笔记)(2015CVPR)

    论文链接:<FaceNet: A Unified Embedding for Face Recognition and Clustering> 摘要 尽管人脸识别领域最近取得了重大进展[1 ...

  2. PS学习-人像照片综合处理(三)--模拟迷幻LOMO风格

    (注:"()"括号内为选择的调整选项,"[]"内为照片哪里不足,"------"后为操作之后的效果) 1.制作暗角(套索工具) (1)按Ct ...

  3. 基于深度学习的Person Re-ID(综述)

    一. 问题的提出 Person Re-ID 全称是 Person Re-Identification,又称为 行人重检测 or 行人再识别,直观上可以通过两种思路进行比对,一种是 通过 静态图像(st ...

  4. Android Camera 实时滤镜(五)

    Android 静态滤镜的实现 一.回顾知识点 1.基本滤镜效果的实现(黑白滤镜) 用到的技术是ColorMatrix.通过改变RGBA的系数,从而改变图像的成像效果. Created with Ra ...

  5. Bootstrap学习(三)——Bootstrap 插件

    Bootstrap学习(三)--Bootstrap 插件 Bootstrap 插件 Bootstrap 自带 12 种 jQuery 插件,扩展了功能,可以给站点添加更多的互动. 站点引用 Boots ...

  6. (翻译)A Deep Learning-Based Approach to Progressive Vehicle Re-identification for Urban Surveillance

    废话(建议直接跳过): 我的毕设是做汽车重识别 今天我第一天认真开始写毕设论文(2021-05-23) 这几天写毕设论文(其实就是打开word,然后玩手机,嘿嘿),明天需要交初稿 给大家见识一下啥叫一 ...

  7. 前端基础之《Bootstrap(13)—JavaScript插件_标签页、工具提示、弹出框、折叠效果和幻灯片》

    一.data-开头的是什么 是bootstrap封装的js. data-toggle data-target data-dismiss data-spy 参考资料:https://blog.csdn. ...

  8. UnrealText: Synthesizing Realistic Scene Text Images from the Unreal World(译)

    UnrealText:合成来自虚幻世界的真实场景文本图像 仅供参考,如翻译不到的请指出,侵权删 来源: CVPR2020,旷视 code 链接: https://jyouhou.github.io/U ...

  9. 行人重识别学习之路:(一)基础知识和相关资料整理

    2018年4月16号,本人研一,今天正式确定了研究方向,从今天起,开始自己的行人重识别的学习之路,因为也是刚开始学习,所以这些笔记也都是在借鉴了经验人士的文章后,再结合自己的理解和思路做出的整理,有不 ...

  10. 年龄估计系列(1)年龄性别调研:论文阅读和github资源汇总/数据库/挑战/思考

    目录 一.论文阅读和github资源汇总 1.1 论文 1.1.1 2012.人脸图像的年龄估计研究 1.1.2 2013.Age Estimation Face Images_Human vs Ma ...

最新文章

  1. 改改 Python 代码,运行速度还能提升 6 万倍,Science:先别想摩尔定律了
  2. 接口重复提交解决方案
  3. java多线程 ThreadPoolExecutor 策略的坑
  4. Hibernate 关联映射 之 多对多 关联(二) 之拆分
  5. 搜索 由浅入深 之一 水题
  6. python中end 1 意思_python中“end=”是什么意思?_后端开发
  7. 查找数组连成环形的和最大的连续子数组
  8. 如何维持手机电池寿命_手机电池不耐用,都怪这些充电坏毛病
  9. 95-190-452-源码-window-Trigger-ContinuousEventTimeTrigger
  10. 前端常用功能记录(一)
  11. HFSS天线设计过程学习笔记
  12. 初学3D建模有这80G笔刷简直绝了
  13. Spring源码分析-Bean生命周期概述
  14. FFT中频谱泄露的两种理解
  15. javaScript实现简单网页倒计时代码
  16. JAVA Swing界面美化 -付费界面库
  17. c++程序员书籍推荐
  18. 2021东北四省赛部分题解
  19. 正在开启,一名金融猎头的二十年 | 专访伯乐百万金融顾问 Leslie Xu
  20. 计算机科学领域外文期刊影响因子排行,2020最新SCI影响因子出炉,中国期刊Top100榜单公布,附最全EXCEL完整版目录!...

热门文章

  1. Tensorflow实现进阶的神经网络
  2. 蚂蚁篇无聊吗?看看猎人骨灰粉丝绝妙分析(1)
  3. 函数式编程-Either函子篇
  4. Pycharm删除键、复制粘贴键失灵解决方案
  5. 数据中心网络架构 — 网络带宽的收敛比
  6. 测试场景设计-登录设计
  7. BI报表工具FineReport的使用1【FineReport使用,看过这篇就够了】
  8. Blender小白最简单方法制作椅子
  9. Obsidian 插件安装
  10. 写好英语科技论文的诀窍: 主动迎合读者期望,预先回答专家可能质疑--周耀旗教授...