“问渠那得清如许,为有源头活水来”,通过前沿领域知识的学习,从其他研究领域得到启发,对研究问题的本质有更清晰的认识和理解,是自我提高的不竭源泉。为此,我们特别精选论文阅读笔记,开辟“源头活水”专栏,帮助你广泛而深入的阅读科研文献,敬请关注。

论文题目:基于不确定因素感知的鲁棒虹膜识别

Towards more discriminative and robust iris recognition by learning uncertainty factors

论文作者:卫建泽(中国科学院大学,中科院自动化所),黄怀波(中科院自动化所),王云龙(中科院自动化所),赫然(中科院自动化所),孙哲南(中科院自动化所)

收录期刊:IEEE Transactions on Information Forensics and Security

论文DOI: 10.1109/TIFS.2022.3154240

代码链接:https://github.com/reborn20200813/uncertainty

01

研究动机

1.1 研究背景

在虹膜识别技术探究的过程中,研究人员已经发现多种因素会显著的影响识别性能,例如采集距离、图像分辨率、光照、设备变更等;事实上,除了这些因素外还有其他的不确定因素在不经意地改变成像效果,进而影响算法的识别性能。具体来说,虹膜图像获取实质上是对人眼、环境和采集设备三者交互过程的单次采样,而交互中的这三大因素都会涉及大量的采集因素——人眼会涉及姿态、运动和遮挡等,环境会涉及光照等,而采集设备会涉及光学镜头、传感器等。即使是人为控制的受控场景,仍无法确保这些采集因素呈不会发生改变的确定态;换而言之,采集过程会无时不刻收到不确定采集因素的作用,而不确定采集因素对于最终成像的影响被称为采集不确定性。

图一:采集过程是对人眼、环境和采集设备三者交互过程的单次采样,该过程涉及多种采集因素。

采集不确定性往往会导致每次成像结果都不尽相同,而这种成像的差异体现在特征空间上是导致不同图像的特征点无法聚焦于同一位置而是围绕某一点分布。现有的特征提取器(不论是基于特征模板还是基于特征向量的算法)采用确定点来表示虹膜图像,具体来说,特征空间中的任意一点都对于某一具体图像。当使用确定点表示方法时,采集不确定性会使得同一目标不同图像的虹膜特征呈现差异,影响最终的验证或识别结果。

1.2 方法动机

由于确定点表示方法无法规避采集不确定性带来的影响,这让我们不得不寻求一种新的表示方法来解决采集不确定性的影响。想要针对采集不确定性来设计算法,首先需要了解采集不确定性如何影响虹膜特征。虽然采集不确定性导致同一目标不同图像的虹膜特征在空间中弥散,但我们仍然可以发现一个基本的规律——同一目标的虹膜特征呈抱团分布,越相似的虹膜图像在空间的距离越近。基于该规律,本文进行了大胆但合理的假设:

(a)根据中心极限定律,同一目标类别的虹膜图像在特征空间中围绕某一确定中心点呈高斯分布。

(b)该确定中心点是一个不受采集不确定性影响的具有判别力的身份特征。

基于该假设,采集不确定性对虹膜特征的影响便清晰了起来。每张虹膜图像采集后包含有两类信息——用于识别的身份信息,影响识别的采集不确定性信息;确定点表示方法无法有效区分这两种信息,导致特征空间中的样本点既包含有识别所需的身份信息也包含有视为噪声的采集不确定性信息;此时,同一目标不同图像的对应样本点具有相同的身份信息,这使得他们呈抱团状,但各异的采集不确定性信息导致他们无法位于同一位置(即假设中的确定中心点);而样本点相对该确定中心点的偏移就是由采集不确定性造成的。

02

不确定因素感知的鲁棒虹膜识别

算法的整体框架如图二所示,在2.1-2.3将对各模块进行分别介绍。

图二:算法整体框架,其中包括蓝色框中归一化图像增强(enhancement),绿色框中的概率隐表达(UE)和红框中对应的基于不确定性引导的课程学习(Uncertainty-Guided Curriculum Learning, UGCL)。

2.1 概率隐表达

为了将身份信息和采集不确定性信息加以区分,本文提出了概率隐表达,该表达方法使用多元高斯分布来表示虹膜图像。

具体来说,对于一张虹膜图像,该表达方法使用如下图所示的编码器来获得其对应目标类别的特征表达z_n。编码器的主干网络首先对图像抽取虹膜特征,然后编码器中的  -分支和   -分支从特征中预测z_n的均值    和方差   。

图三:生成概率隐表达的编码器。

基于预测结果, z_n 可使用如下的高斯分布来进行表示:

其中均值  编码了该目标类别的身份信息,而方差  单独为每个特征维度编码了其采集不确定性。此时,输入图像对应的虹膜特征可视为对 z_n分布的一次特殊采样。

基于该表示,我们可以通过从标准正态分布中随机采样一个噪声来生成新的虚拟虹膜特征,获得的虚拟特征本质为数据在特征层的一次合理增广,有助于确保数据的多元性。本文利用增广来模拟采集不确定性对虹膜特征点的影响,利用这些增广后的虚拟特征来进行模型训练,可提升算法的鲁棒性;但测试过程仅关注身份信息,可利用  -分支获得的均值  来进行身份识别。

2.2 不确定性引导的课程学习

在1.2中可知不同样本点由于收到的采集不确定性影响不同,样本点距离中心的距离也各有差异,而虚拟特征也是同理——距离均值点较近的特征受采集不确定性影响较小,对应高质量的成像结果,而距离均值点较远的特征受采集不确定性影响较大,对应降质图像。

根据之前的工作可知,使用高质量的图像有助于提升模型精度却无助于鲁棒性提升,而使用降质图像有助于提升模型的鲁棒性却影响模型收敛和精度提升,本文提出了配套概率隐表达的学习策略。

该策略的核心想法是在训练早期优先使用高质量的虚拟特征(对应论文中的容易样本,easy samples)来快速收敛模型并确保模型精度,而且在后续引入降质的虚拟特征(对应论文中的困难样本,hard sample)来提升模型鲁棒性。具体做法是根据虚拟特征的生成过程来计算样本的困难程度,在开始训练阶段使用困难程度较低的特征来优化模型,然后逐渐引入困难程度较高的特征来巩固模型优化,最终达到又准确又鲁棒的目的。

2.3 归一化图像增强

前面的内容中大量的讨论了采集不确定性,这些采集不确定性各种场景或识别设定中普遍存在,但仍有一种潜在的采集不确定性没有讨论,那就是跨库场景中的采集不确定性。

在一个识别场景中,有些采集因素被预先设定(比如采集设备的型号等),而有些采集因素则是不确定的(比如采集距离、光照、瞳孔放缩情况等);前者往往被视为确定因素,而后者被视为不确定因素。然而,确定因素并不总是确定的,在常规的库内识别设定下,由于训练数据的存在,测试数据中采集因素的确定与否是可被感知和学习的,其中采集因素的不确定性被  -分支所学习;而在跨库识别设定下,训练数据是缺失的,这意味测试数据中采集因素的确定与否无法感知,因为  -分支只能通过训练数据来建模的不确定性信息。这种不可学习的采集不确定性是概率隐表达无法建模的,因此本文提出了归一化图像增强来针对该问题来进行解决。

该增强方法分为基于局部统计量和基于全局统计量的两个增强步骤。基于局部统计量的增强步骤聚焦于图像的 3x3 局部区域,利用局部区域内的中值来平滑方法来消除图像噪声造成的采集不确定性。而基于全局统计量的增强步骤统计了图像整体的一阶和二阶统计量,并以此为参考来调整图像。这种基于局部和全局统计量的增强方法有效改善了归一化图像,解决了预训练设定中不可学习的数据不确定性的负面影响;事实上,实验表明这种增强方法对于其他阶层设定同样有效。

03

实验结果

3.1 同设备识别

本文所提方法在CASIA-irisV4-Lamp、CASIA-irisV4-Thousand、CASIA-irisV4-Distance 和 CASIA-iris-Mobile-V1四个同设备数据集上进行了库内和跨库两种设定的测试。表一和表二分别展示了在库内和跨库两种设定下的性能对比

表一:库内设定下的同设备识别性能对比

表二:跨库设定下的同设备识别性能对比

3.2 跨设备识别

跨设备识别是相较于同设备识别更具挑战性的识别难题,该任务需要算法使用某一型号的设备来进行用户注册,然后使用另外型号的设备来进行用户识别。本文在ND-CrossSensor-Iris-2013和CASIA Cross Sensor Iris Recognition两个数据集上进行了库内和跨库两种设定的识别。表三和表四分别展示了算法在库内和跨库两种设定下的识别结果。

表三:库内设定下的跨设备识别性能对比

表四:跨库设定下的跨设备识别性能对比

04

相关扩展

本文的工作也可以用于无监督虹膜识别,相关的工作已在IJCB 2021进行口头汇报,

论文题目为:Contrastive Uncertainty Learning for Iris Recognition with Insufficient Labeled Samples,

相关代码链接为:https://github.com/reborn20200813/CUL

致谢

本研究成果得到了中国人工智能学会-华为MindSpore学术奖励基金的资助。

MindSpore官网:https://www.mindspore.cn/

“源头活水”历史文章建模原型优化过程为一种连续时间的Neural ODE
CVPR 2022 | 针对目标检测的重点与全局知识蒸馏(FGD)
CVPR 2022 | CrossPoint:自监督3D点云场景理解
CVPR 2022 | 通过空间结构对齐实现高质量小样本图像生成
ICML 2022 | 共识表征提取和多样性传播的解构联邦学习框架
用于单目双目RGBD相机的深度视觉SLAM
AAAI 2022 | 知识图谱表示模型是如何外推的
Oriented RepPoints for Aerial Object Detection
CVPR | 2022 基于序列对比学习的长视频逐帧动作表示
CVPR 2022 | QueryDet: 使用级联稀疏query加速高分辨率下的小目标检测
MIR 2022 | 反者道之动, 基于因果推断的可解释对抗防御
自监督/弱监督:SimCLRV2论文解读
图上结构信息与GNN-STARGNN更多源头活水专栏文章,请点击文章底部“阅读原文”查看分享、在看,给个三连击呗!

【源头活水】IEEE TIFS 2022 | 基于不确定因素感知的鲁棒虹膜识别相关推荐

  1. 深度学习-Resolution-robust Large Mask Inpainting with Fourier Convolutions基于傅里叶卷积的对分辨率鲁棒的掩模修复

    Resolution-robust Large Mask Inpainting with Fourier Convolutions基于傅里叶卷积的对分辨率鲁棒的掩模修复 0.摘要 1.概述 2.方法 ...

  2. 基于成像激光雷达的鲁棒位置识别

    点云PCL免费知识星球,点云论文速读. 文章:Robust Place Recognition using an Imaging Lidar 作者:Tixiao Shan, Brendan Englo ...

  3. c++ hough变换代码_基于Haar小波和Log-Gabor变换的虹膜识别方法

    在虹膜的识别研究方面,学者提出多种识别方法.DAUGMAN J提出使用二维Gabor变换提取虹膜特征[1]:谭铁牛等使用多通道Gabor滤波器提取虹膜特征[2-3]:LIM S等用二维小波对虹膜进行特 ...

  4. Patchwork++论文阅读——基于3D点云的快速鲁棒地面分割算法

    文章目录 摘要 1. 介绍 2. 相关工作 A. 基于学习的地面分割方法 B. 传统的地面分割方法 C. 地面分割的应用 3. PATCHWORK++:快速.稳健.自适应的地面分割 A. 问题定义 B ...

  5. NeurIPS 2022 | 基于对齐引导时间注意力机制的视频动作识别

    ©作者 | 张海涛 单位 | 重庆邮电大学 研究方向 | 视频理解 论文标题: Alignment-guided Temporal Attention for Video Action Recogni ...

  6. 基于深度学习的大规模vSLAM场景中的鲁棒视觉位置识别

    Towards a Robust Visual Place Recognition in Large-Scale vSLAM Scenarios Based on a Deep Distance Le ...

  7. 解读ICDE‘22论文:基于鲁棒和可解释自编码器的无监督时间序列离群点检测算法

    摘要:本文提出了两个用于无监督的具备可解释性和鲁棒性时间序列离群点检测的自动编码器框架. 本文分享自华为云社区<解读ICDE'22论文:基于鲁棒和可解释自编码器的无监督时间序列离群点检测算法&g ...

  8. 【论文摘要】基于多数投票模式和超混沌加密的彩色图像鲁棒安全零水印算法

    Robust and secure zero-watermarking algorithm for color images based on majority voting pattern and ...

  9. IEEE VR 2022

    会议简介 IEEE的VR会议,从1993年开始,一年一届.2004年开始,主要方向为3D用户接口和3D虚拟环境交互的IEEE Symposium on 3D User Interfaces (3DUI ...

最新文章

  1. SpringSecurity学习:1(第一个SpringSecurity项目)
  2. 数字图像处理基础知识之二
  3. Sklearn 损失函数如何应用到_Sklearn库主要模块功能简介
  4. AOP 在Spring 中的应用
  5. 在虚拟机中的Ubuntu搭建java开发环境
  6. 前端学习(911):PC端网页特效
  7. Selenium Webdriver ie 浏览器
  8. Netty入门篇-从双向通信开始
  9. 状态机——protothreads
  10. python爬虫爬图片教程_python爬虫实战之爬取京东商城实例教程
  11. java基础(一)-面向对象思想
  12. C盘文件内容及清理思路
  13. java jdbc元数据_JDBC元数据详解
  14. 嵌入式课程设计-- 电子时钟
  15. sir模型初始值_经典传染病的SIR模型(基于MATLAB)
  16. Python GUI案例之看图猜成语开发(第一篇)
  17. 如何做一个简单的类似qq网页版等的聊天网页
  18. Django 前戏
  19. ezw证件照芯片压缩算法
  20. 开放世界--OpenWorld

热门文章

  1. 带你了解 HTTP 协议
  2. Apache Ratis中的multi-raft实现原理
  3. 电池pack结构_电池PACK是什么?锂电池包PACK结构设计需要考虑哪些因素?
  4. Vue脚手架使用步骤
  5. 前端websocket连接mqtt服务器(Paho-mqtt,mqttws31.js)以及断开重连
  6. 如何查询网站服务器供应商,查询网站服务器提供商
  7. 下一代隐私基础设施的主要介绍
  8. 区块链在游戏产业掀起狂潮
  9. C#开发Windows Service程序
  10. C#写Windows Service(windows服务程序)