2020

背景:

作为一种新兴的识别技术,步态识别具有在非受控、远距离、低分辨率的场景下进行身份识别的优点,并且步态不易改变和伪装,所以近年来得到的关注逐渐增多。

步态识别作为一种新兴的身份识别技术,可以根据人们走路姿势的不同来区分个体身份。与现有的如人脸、指纹等需要近距离采集且需要人员配合的生物特征相比,步态具有低分辨率、受环境影响小、易采集等优点。此外,行人步态可以在个体毫无觉察的情况下被采集到以进行识别,而且行人走路姿势也难以伪装和模仿。步态识别的这些优势使得其最近受到研究人员的关注越来越多。目前,在丹麦、英国等国家和地区,步态分析己经在刑事犯罪案件中投入使用,办案人员通过步态识别系统分析可疑人员的走路姿态,以提升筛查效率和准确性,降低了因人脸识别、行人重识别等技术失效和人工筛查的低效性所导致嫌犯逃离的可能性。
但是在日常生活中,监控系统中捕获的步态样本与注册的步态样本往往存在视角差异,这会大大的削弱经典步态识别算法的有效性。所以,解决跨视角步态识别问题、提高步态识别的准确性和实时性,是步态识别产品必须要攻克的技术难题。
当前困难
目前跨角度步态识别的困难在于行人步态在不同视角下的视觉差别巨大。由于步态特征仅包含行人的体型轮廓以及走路姿态信息,不包含颜色和纹理特征,这使得从不同视角的步态中,很难提取表征行人身份的视角不变性特征。为了解决步态识别在跨角度时识别率低的问题

当前解决方法

第一类是通过全景相机或多个校准相机进行3D步态信息构建的跨角度识别方法
这些方法需要复杂的可控摄像机的设置,这在实际应用中难以实现。另一方面,这些方法计算负荷大,进一步限制了其实际应用的可能。
第二类是基于视角转换模型VTM的跨视角识别方法。这种方法利用来自其他视角的信息集中使用诸如奇异值分解和回归等技术来构建步态特征。
VTM方法仅仅减小了变换视角的步态特征与原始特征之间的差异,并没有考虑不同个体间的判别性因素,且这类方法在建模计算时很容易造成噪声传播,导致识别率不佳。
第三类是提取具有视角不变性的步态特征。
受限于步态数据跨视角步态标签不足的问题,很难完成模型训练,并且通常使用的损失函数都是生搬硬套人脸识别任务中广泛使用的损失函数

提取对视角变化不敏感的特征可以减小现实场景中视角多变对步态识别技术有效性的影响,实现无论行人以何种角度经过摄像头,都能准确识别出目标身份的目的,这会大大提高步态识别技术的鲁棒性和实际应用价值,推进步态识别技术产业化和标准化,形成完整的产品或服务以在现实生活中发挥作用

当前困难的本质

同一个人的步态从各个角度拍摄成像的步态轮廓是不同的,而且拍摄视角差别越大,同一行人的差异就越大。对于人类而言,这个问题往往可以通过大脑中复杂的运算推理和三维转换判断出这些不同视角的步态是否来自同一个人。但是,对于计算机而言,其输入仅仅是由离散像素点排列而成的二维数字图像,要通过这些像素点来解决视角不变问题是非常有挑战性的。另外一方面,步态特征是不包含行人的穿着等颜色和纹理特征,仅包括行人的轮廓以及行走姿势特征,所以我们无法从颜色和纹理上推理出视角的转换关系,这无疑增加了跨视角的识别难度。对于步态特征而言,可以认为其仅包含三类信息:视角信息、身份信息以及由不同穿着、背包、轮廓分割误差所产生的噪声千扰信息。因此,如果能够将步态特征中的视角信息和身份信息进行分离,仅用只包含身份信息的特征进行识别,会大大提升跨视角步态识别的精度,提高抗视角千扰能力。
给定一个查询样本,跨视角步态识别的目的是从与该查询样本视角不同的某视角的注册数据集中正确找到与该查询样本身份相同的注册样本。

其中,G表示生成的步态能量图中位置(i,j)的像素值,s表示步态序列中/时刻的步态剪影图的位置(i,j)的像素值,T表示此步态序列的长度。实际应用中,在计算步态能量图之前,要先进行步态的矫正和对齐,使每个时刻的步态剪影图的重心位置重合。

(将仅有的两个特征视角和身份拆开分析)

本章提出了身份与视角特征分离的跨视角步态识别算法,将步态特征中的视角信息和身份信息进行分离,仅用只包含身份信息的特征进行识别,提升了跨视角步态识别的精度,提高了抗视角干扰能力。为了保证所提取的身份特征与视角特征是来自该步态样本的全部信息,本章采用了自编码器的方式来恢复原始输入的步态样本,设计了视角编码器、身份编码器和步态解码器。
(将仅有的两个特征视角和身份一起分析)
在步态识别任务中,如何提取既具有身份判别能力还具有视角不变性的特征是提高步态识别精度的关键。而在现实生活中,人们往往只需要关注行人走路时身体的一部分运动特点和体型特点就可以判断出该行人的身份,这意味着行人身体的不同部分在步态特征表达中所占的权重是不一样的,所以对行人身体进行分块是很有必要的。在具体特征表达方面,水平金字塔是一种在水平方向上的多尺度特征提取方法,并且己经被证明在行人再识别任务上有出色的表现。

展望:

虽然提纯身份特征的损失可以提高识别率,但是这只说明组合损失有利于增强表征判别性,但可能特征里还有干扰。解决思路:研究特征的分布,可视化(TSNE?);GAN分解步态样本
在数据集上的效果并没有明显超越前人,原因是数据集视角较少且相邻视角跨度很小。说明此方法在视角差别很小时对步态样本的身份和视角特征分离的作用不明显,所以未来可以设计更精细的网络来解决此问题;
背包、不同穿着等情况下存在泛化性能挑战。未来可以尝试通过特征选择来解决,对于那些表达背包和穿着的干扰信息,用特征选择的方法将其滤除,可能会取得更好的识别效果。(行人重识别还好说,有颜色啥的分割,这全是白块怎么知道哪是背包,哪是穿着)

读《基于深度学习的跨视角步态识别算法研究》相关推荐

  1. 读《Android 安全架构深究》

    Android 安全架构深究 安全是一个非常立体而丰富得概念.在不同的场景下,安全有着不同的含义. 比如对于网络传输,安全指的是传输的数据不会被其他人看到.篡改.伪造及仿冒,传输的数据不会遭到破坏,数 ...

  2. 《最强Android书 架构大剖析》读书笔记

    文章目录 第一章 Android 体系结构的变革之路 1.2 Android系统源码目录 与Linux的异同 Android的框架 原生二进制可执行文件 Android 的原生库 核心(core)库 ...

  3. Android Jetpack架构组件之 Room(使用、源码篇)

    2019独角兽企业重金招聘Python工程师标准>>> 1.前言 最近简单看了下google推出的框架Jetpack,感觉此框架的内容可以对平时的开发有很大的帮助,也可以解决很多开发 ...

  4. 抖音、美团等大厂千万级用户的Android客户端架构演进之路—

    在移动开发中,对开发者来说不同的人具有不同的能力.就像读一本书一样,一千个读者,有一千个哈姆雷特.但不管怎样,只要你是个软件开发者你就必须学习windows或Linux等操作系统的运行原理.Andro ...

  5. Android 图形架构之一 ——概述

    前言 本系列的文章,可以让你明白,一个View最终是如何显示到屏幕上的,从应用层到硬件抽象层.对分析app的卡顿,掉帧等 有很大帮助. 由于图形架构的涉及到的代码量很大,所以本篇先来个总体的概述,有个 ...

  6. Android display架构分析-SW架构分析(1-8)

    参考: Android display架构分析二-SW架构分析 Android display架构分析三-Kernel Space Display架构介绍 Android display架构分析四-m ...

  7. 高通Android display架构分析

    目录(?)[-] Kernel Space Display架构介绍 函数和数据结构介绍 函数和数据结构介绍 函数和数据结构介绍 数据流分析 初始化过程分析 User Space display接口 K ...

  8. [Android] Android MVP 架构下 最简单的 代码实现

    Android  MVP 架构下  最简单的 代码实现 首先看图: 上图是MVP,下图是MVC MVP和MVC的区别,在于以前的View层不仅要和model层交互,还要和controller层交互.而 ...

  9. Android系统架构-[Android取经之路]

    摘要:本节主要来讲解Android的系统架构 阅读本文大约需要花费10分钟. 文章首发微信公众号:IngresGe 专注于Android系统级源码分析,Android的平台设计,欢迎关注我,谢谢! 欢 ...

  10. Android系统架构图及简单的系统架构介绍

    2019独角兽企业重金招聘Python工程师标准>>> ndroid的系统架构和其操作系统一样,采用了分层的架构.从架构图看,android分为四个层,从高层到低层分别是应用程序层. ...

最新文章

  1. Pycharm+Django搭建第一个Python Web程序
  2. Day4-springmvc中文乱码处理和客户端跳转
  3. AI入门:不用任何公式把主成分分析讲清楚
  4. java 拼音模糊查询_java实现首字母模糊查询的功能
  5. SAP S4HANA使用ABAP获得生产订单的状态
  6. 5gh掌上云计算认证不通过_阿里云ACP认证考试攻略、考试心得、费用及常见问题...
  7. 使用Eclipse进行远程调试 外加 ant 直接打包到服务器
  8. 什么是pisa测试_什么是好作业?十年前,上海开启一项作业改革探索,专家发现了这些问题……...
  9. 51nod 1412
  10. python交换模式、vim模式TAB自动补齐
  11. java gbk转机内码_GBK/GB2312编码问题分析以及java获取汉字国标码
  12. 使用google doc制作在线问卷调查表
  13. 【Nginx】关于二级域名配置https
  14. HM-3200: Tetramesh(四面体网格)
  15. Python金融领域人工智能教程
  16. 【zz】P2P技术简介—by红瞳
  17. javaIO异常之EOFException
  18. kindeditor富文本编辑器的使用
  19. 禅道 my.php debug,PHP vscode+XDebug 远程断点调试服务器上的代码
  20. 为什么你不应该用mongodb【转】

热门文章

  1. 数据仓库3_ETL_数据清洗/装载
  2. springboot集成mybatis-plus
  3. [Java]基于JDBC的学生信息管理系统的实现
  4. 提取nk.nb0中的文件
  5. 我,大二实习,996,月工资800
  6. [批量重命名工具] 批量图片识别文字来命名文件名,很多网友想看批量图片识别成文字,用图片上的文字来修改文件名,今天它来了
  7. 2021年CSP-J入门级初赛(第一轮)真题讲解
  8. python office365_Python 使用office365邮箱的示例
  9. 爱快软路由NAT-VMware-esxi-vsphere-虚拟机共享上网
  10. 自动化脚本编写实例-python