Title

GaitSet: Regarding Gait as a Set for Cross-View Gait Recognition
原文地址:https://arxiv.org/abs/1811.06186v4
github:https://github.com/AbnerHqC/GaitSet

Summary

这篇论文提出了一种新的解决步态识别的视角,将传统的输入内容GEI取代,在确保训练难度低和准确率高的情况下提出一种新的算法模型——GaitSet,将步态序列作为输入序列,包含了时间信息和空间信息,让步态识别更加准确,实用性变高。

New idea or Questions

  1. Multiple Walking Conditions下单一视角,有限轮廓图状态下,利用SP是否能够提取出相应特征并保证准确率。
  2. 不连续的步态序列,或者打乱的步态序列是否可以保持准确率。

Research Objective

提升步态识别在多视角下的准确率

Problem Statement

  • 步态模板很容易丢失时间和细粒度的空间信息的问题
  • 步态轮廓序列提取容易受到外部因素影响的问题
  • 用于提取序列信息的深度神经网络比GEI单个模板的深度神经网络更难训练的问题。

Method(s)

论文中提出一种新的思路,即将步态识别特征视为一组步态轮廓图,作为周期性运动,步态可以由一个周期表示。

  1. 概述:将步态视为一组序列。给定一个数据集,数据集中一共N个人,每个人用yi表示。假设某个人的步态轮廓分布PiP_iPi​只与这个人的ID有关。因此,在一个或多个序列中,所有的轮廓可以被看做是Xi = { xijx_i^jxij​ | j = 1,2,…,n}, 其中 xijx_i^jxij​∼PiP_iPi​
  • F是卷积网络,从每个步态轮廓中提取帧级特征。
  • G是用于将一组帧级特征映射到序列级特征的排列不变的函数,通过Set Pooling(SP)实现。
  • H是用于序列级特征中学习Pi的辨别表示。此函数通过Horizontal Pyramid Mapping(HPM)实现。
  • 输入Xi是四个维度的tensor,分别是序列维度,图像通道维度,图像高度和图像宽度维度。
  1. Set Pooling
    Sp的目的在于收集一下整个序列的步态信息。z = G(V ),z表示序列级特征,V表示帧级特征。
  2. Horizontal Pyramid Mapping
    问题:将特征图分割成条的方式经常用于人的重新识别任务。根据行人大小裁剪图像并将其尺寸调整为均匀尺寸,但辨别部分仍然因图像而异
  • 提出用Horizontal Pyramid Pooling(HPP)来解决上述问题,利用HPP的4个等级,帮助深度网络同时提取局部和全局特征。
  • 如图所示,对每个池化后的特征使用独立的完全连接层将其映射到判别空间,而不是在合并后应用1*1卷积层。(HPM)
  • 首先,PM具有S个尺度,在尺度s ∈ 1,2,…,S上,由SP提取的特征图在高度尺寸上被分成2s−12^{s-1}2s−1条,即总共∑s=1S2s−1\sum_{s=1}^{S} 2^{s-1}∑s=1S​2s−1条。
  • 其次,用一个全局池化将3维strips变为1维特征。
  • 最后,使用FC将特征映射到辨别空间。
  1. Multilayer Global Pipeline
    SP提取的序列级特征在不同层有相似的属性。如图1所示的主流程,在卷积网络的最后只有一个SP。为了收集不同级别的序列信息而提出Multilayer Global Pipeline (MGP)

Evaluation

数据集:CASIA-B ,OU-MVLP
样本:小样本训练(ST)、中样本训练(MT)、大样本训练(LT)

Limited Silhouettes 有限轮廓数量
1)随着轮廓数量的增加,精度单调上升。

2)当样本含量超过25个轮廓后,正确率接近最佳状态。这个数字与一个步态周期所包含的帧数一致。

Multiple Views 多视角

  • 有些情况下收集到的是一个人不同视角的步态信息

Multiple Walking Conditions

  • 现实生活中,很可能同一个人有不同的行走状态

Conclusion

本论文提出了一种新的方法解决步态识别,目前是CASIA-B数据集上准确率最高的算法。GaitSet可以比那些将步态作为模板或序列的现有方法更有效地提取空间和时间信息。它还提供了一种从不同序列聚合有价值信息的新方法,以提高识别准确性。两个基准步态数据集(公开标准数据集)的实验表明,与其他最先进的算法相比,GaitSet实现了最高的识别精度,并在各种复杂环境中显示出广泛的灵活性,在实际应用中显示出巨大的潜力。

Notes

【论文笔记】GaitSet: Regarding Gait as a Set for Cross-View Gait Recognition相关推荐

  1. 行为识别论文笔记|TSN|Temporal Segment Networks: Towards Good Practices for Deep Action Recognition

    行为识别论文笔记|TSN|Temporal Segment Networks: Towards Good Practices for Deep Action Recognition Temporal ...

  2. 【深度学习论文笔记】DeCAF: A Deep Convolutional Activation Feature for Generic Visual Recognition

     时间:2014/7/29 10:00 论文题目:DeCAF: A Deep Convolutional Activation Featurefor Generic Visual Recognit ...

  3. 论文笔记NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis

    NeRF使用神经网络来表示场景.给定一个场景,输入该场景一些视角的图片,NeRF可以合成该场景新视角的图片. 神经辐射场 神经辐射场(neural radiance field,NeRF)使用5D的向 ...

  4. ORB-SLAM3 论文笔记

    ORB-SLAM3 论文笔记 这篇博客 ORB-SLAM3系统 相机模型的抽象(Camera Model) 重定位的问题 图片矫正的问题 视觉惯性SLAM的工作原理 相关公式 IMU初始化 跟踪和建图 ...

  5. 【论文笔记】 LSTM-BASED DEEP LEARNING MODELS FOR NONFACTOID ANSWER SELECTION

    一.简介 这篇论文由IBM Watson发表在2016 ICLR,目前引用量92.这篇论文的研究主题是answer selection,作者在这篇论文基础上[Applying Deep Learnin ...

  6. 最新图神经网络论文笔记汇总(附pdf下载)

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 [导读]近年来,图神经网络变得非常火热,每年顶会在该领域内都会出现大量的研究论文,本文为大家提 ...

  7. [论文笔记] Fast Quality Driven Selection of Composite Web Services (ECOWS, 2006)

    Time: 4.0 hours Jae-Ho Jang, Dong-Hoon Shin, Kyong-Ho Lee, "Fast Quality Driven Selection of Co ...

  8. 论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning

    论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning  2017-06-06  21: ...

  9. 光流 速度_[论文笔记] FlowNet 光流估计

    [论文笔记] FlowNet: Learning Optical Flow with Convolutional Networks 说在前面 个人心得: 1. CNN的光流估计主要是速度上快,之后的v ...

  10. 论文笔记 《Maxout Networks》 《Network In Network》

    原文出处:http://zhangliliang.com/2014/09/22/paper-note-maxout-and-nin/ 论文笔记 <Maxout Networks> & ...

最新文章

  1. 几十亿打水漂!世界最大移动通信展MWC因疫情33年来首次取消,多方损失惨重...
  2. 基于fabric框架区块链实现科学数据出版系统
  3. 如何避免HBase写入过快引起的各种问题
  4. Spring AOP编程-aspectJ通知类型-6大通知
  5. 数据仓库中捕获变化数据(CDC,Changed Data Capture)的四种手法
  6. LeetCode Algorithm LCP 44. 开幕式焰火
  7. 23行代码_动图展示——快排详解(排序最快的经典算法)
  8. C# Thread开启线程几种方式
  9. python round保留小数位_Python-其他-round()保留小数位时遇到的问题
  10. L1-055 谁是赢家 (10 分)—团体程序设计天梯赛
  11. 上海市二级c语言软件环境,上海市2019年9月计算机二级考试复习教程:(C语言)上机考试新版题库+全真模拟试卷(2本装)...
  12. c语言程序有哪几类词汇,c语言是什么 必背词汇有哪些
  13. Ubuntu 16.04 双网卡 同时上内外网
  14. table表格头部和前几列固定js
  15. 码云的注册与使用,很简单
  16. MAC 安装opencv的过程
  17. 交换机连接路由器计算机联网,交换机上连接路由器_连上路由器(交换器)后部分电脑无法上网的解决方法_交换机上接路由器...
  18. 初中计算机课感悟,初中信息技术课教育随笔
  19. html5动态连线,canvas简单连线动画的实现代码
  20. 哪些安卓手机和IPhone手机浏览器可以安装油猴Tampermonkey插件

热门文章

  1. JavaScript基本结构
  2. 【刘二大人 - PyTorch深度学习实践】学习随手记(一)
  3. [高通SDM450][Android9.0]刷机后RTC时钟不生效问题
  4. python语言语块句的标记_个人学习记录
  5. Concept Whitening(for Interpretable Image Recognition)
  6. SQL语句整理三--hive
  7. 进入BIOS+制作u盘启动盘+将u盘启动盘设置为开机首选方法
  8. 从零开始使用 IDEA 开发插件 (一)
  9. 分享企业融资技巧与方法及常见有效融资途径
  10. 通达信挖掘大牛浮水指标公式源码