受访者 | 墨奇科技联合创始人& CTO 汤林鹏

记者 | Aholiab,编辑 | Carol

出品 | AI科技大本营(ID:rgznai100)

随着深度学习等AI技术的成熟,生物识别成为了关注度较高的领域,指纹、人脸、虹膜等识别技术,正在越来越多的场景中得到应用。根据前瞻产业研究院的数据,目前中国生物识别技术的市场规模已超过300亿元,到2023年,这一数字将达到379亿元。虽然人脸识别、虹膜识别近几年大有成为「后起新贵」之势,但指纹识别凭借其“证据之王”的权威性和较高的安全性,仍然占据整个生物识别领域的半壁江山(52%)。

在生物特征识别产业中,有这样一家公司,他们利用AI+指纹识别技术,解决了传统指纹识别耗时长、精确度低、指纹大库搜索困难、无法处理低质量指纹等问题。通过海量高精度图像搜索技术,实现了20亿枚指纹秒级精准对比的落地应用;同时,其自主研发的非接触3D指纹采集技术,也已在强身份认证领域获得应用。这家公司就是墨奇科技。

作为墨奇科技的联合创始人兼CTO,汤林鹏在普林斯顿大学获得博士学位,曾在KDD、AISTATS、OSDI、ATC等顶级机器学习和系统会议上发表多篇论文。早在读博期间,他就开始了机器学习和人工智能方面的研究,并开发出了一套高精度的图像搜索系统,这套系统成为了墨奇科技业务方向和核心技术的开端。尽管彼时深度学习的发展已相对成熟,但谈到成立墨奇科技的初衷时,汤林鹏坦言:“还是想在AI的原理和应用上,做出比较大的突破,继续推动技术的发展。”

不久前,CSDN记者采访到了汤林鹏,对于AI在指纹识别领域中的应用、指纹识别技术创新,以及墨奇科技的发展等话题,与他进行了畅谈。对于AI创业者和开发者来说,相信通过汤林鹏的分享,一定会让你对AI技术的应用与创新,有更深的理解。

「小众」赛道不小众,为何要做指纹识别?

CSDN:你从什么时候开始研究深度学习,你的技术生涯是怎样的?

汤林鹏:我最早关注深度学习是我本科刚毕业的时候,大概是2012年,那个时候深度学习还处在早期阶段,但国内已经有一批公司在这个领域做了。我个人对这个领域也比较感兴趣,所以在博士期间开发出了一套高精度的图像搜索技术,并将其运用到了指纹识别之中。这也成为了成立墨奇科技的契机之一。

2017年博士毕业后我就回国了。主要是看到AI在国内的落地更优势,包括计算机视觉、图像感知、工业互联网、NLP等领域,关注度都非常高。此外,我当时也觉得,虽然深度学习历经了四五年的发展后已经相对成熟,但依然有一些瓶颈需要突破,因此希望能在方法论上去做一些创新。

CSDN:我记得那个时候,很多初创公司都是选择切入到图像识别、人脸识别等较宽的赛道,为什么你们却瞄准了指纹识别这么一个相对细分的领域?

汤林鹏:这里有一个误区,其实指纹识别的市场并不小。我们可以看看前瞻产业研究院的预测,到2021年生物识别的市场规模将达到340亿元,而在生物识别中,指纹识别的占有率为52%,这样来看的话,其实指纹识别是一个百亿级别的市场。

究其原因,是因为指纹识别相比于其他的生物识别方式更加成熟,指纹门禁、手机指纹解锁、二代身份证、护照等都已经应用了指纹识别技术。而另一方面,中国这样的人口大国,特别需要通过指纹识别实现全民的身份认证,从而进入智能社会的快车道,因此我们才希望能在这一领域做出一些技术突破,提供一系列能够落地的AI解决方案解决现实的难题。

CSDN:既然指纹识别已经是一个发展迅速且相对成熟的领域,那么还有哪些「现实的难题」呢?

汤林鹏:传统的指纹识别中,其实还有不少可以提升的空间,主要包括以下几个方面:

  • 耗时长,专业指纹人工编辑非常费时,对相关专家要求较高;

  • 精确度低,大库容比对时唯一比中率不足;

  • 海量指纹搜索困难,随着指纹库容增大,系统计算会造成延时甚至宕机;

  • 安全及隐私风险,指纹信息一旦泄露会造成一定的欺诈风险;

  • 无法处理低质量指纹。

重新定义指纹识别技术

CSDN:针对上述传统指纹识别中的痛点,墨奇科技做了哪些技术创新?

汤林鹏:我们研发出了高精度图像搜索引擎技术,它包含三个部分:图像的自适应多尺度表示和索引系统、无标注或极少标注的自学习框架,以及高速异构的搜索系统。通过这套技术我们可以实现20亿量级指纹图像秒级识别。

墨奇高精准图像搜索引擎架构

CSDN:可以分别讲讲这三个部分的作用及基本原理吗?

汤林鹏:好的。我们首先讲讲图像的多尺度表示和索引系统,在展开前,我们不妨先来看看传统的指纹识别的原理是怎样的。传统的指纹识别主要依靠的是特征点,比如手指上的纹线、纹线的分叉和断点等。但在真实场景中,指纹的质量往往比较低,模糊、残缺、扭曲都十分常见,给识别增加了难度。

而在我们的多尺度算法索引下,我们会按照整体到局部在到细节等多个尺度,对指纹图像进行特征提取,不同尺度之间我们还会考虑它的多样性刻画。相比于传统的指纹识别,这种算法可以提取到更多的信息,看到更多的细节。而相比于深度学习算法,这种多尺度的算法则可以更有效地对质量较差的指纹进行识别。

高精度图像搜索数学模型

再说说只需极少量样本的自学习框架。其实这一框架与上面的多尺度表示是相辅相成的。传统的深度学习框架需要大量的标注数据,其原因在于一张图片能提取的特征只有一两个。比如要识别一只猫的体态,需要对成百上千张不同体态的猫的图片进行特征提取,才能完成训练。而在多尺度多样化表示的算法中,一张图中就可以提取出成百上千个特征,这样一来,我们所需要的样本数量就可以压缩到传统深度学习的千分之一,甚至万分之一。不仅如此,由于有了多尺度多样化表示这一特点,图像搜索过程中对于误差的容忍性也提升了数十倍。

最后是高速异构的搜索系统,它的核心是通过对图像搜索精度要求的判断,来调用不同的运算资源。对于量大且不需要高精度的图像,可以使用GPU来进行运算;而对精度要求较高的图像则调用CPU来进行运算,从而实现指纹图像的高速比对。完成比对之后,系统会对相似度较高的结果进行排序,就类似网页搜索引擎反馈的排名较高的搜索答案一样。

高性能异构搜索系统

CSDN:刚才我们讲到的是指纹的搜索和比对,其实指纹的采集也是很重要的一个环节,一般的指纹都是通过指压的方式进行采集的,但我了解到墨奇科技研发出了非接触指纹识别技术,请问研发这一技术的原因是什么?

汤林鹏:原因有三。第一是指纹识别在应用上的普及,无论是办证、出入境还是其他场景,指纹识别都是首选的生物识别方案。传统的指纹采集方式却存在一些弊端,例如手指表面的脱皮、破损、干湿度、按压力度/角度,都会造成指纹的畸变,导致指纹的质量降低。而多次反复采集又非常耗时。

第二,得益于深度学习的发展及行业的积累,现在我们已经有能力对低质量的指纹进行处理。

第三,随着边缘计算、AI芯片的发展,边缘端的计算能力得以增强,一些图像处理过程完全可以在边缘端去实现。

另外,新冠疫情也让大家深刻体会到非接触指纹采集的重要性。不少国家接触式的指纹门禁已经被禁用,出入境指纹采集后还需要消毒,非常的不卫生不方便。美国国家标准与技术研究所(NIST)最近也加速了非接触指纹技术的评估和推广。

https://www.nist.gov/news-events/news/2020/05/nist-study-measures-performance-accuracy-contactless-fingerprinting-tech

我认为,这几点是历史性的机遇,也是我们为什么要做非接触指纹识别的原因。

CSDN:那么非接触指纹识别的技术原理是怎样的?

汤林鹏:主要原理是基于多目视觉+结构光这样一个三维成像方法,从不同角度来重建指纹的三维曲面,再进行融合,然后再对指纹信息从三维曲面到二维曲面进行展开,这样就得到了一个高质量、大面积的指纹。

与一般3D扫描不同的是,墨奇的非接触指纹采集的精度非常高,可以精确到亚毫米。

CSDN:在人脸识别中3D扫描技术可以对人脸的真实性进行判断,那么3D扫描指纹是否也可以对指纹的真假进行判别?

汤林鹏:没错,在指纹识别中我们称之为「活体指纹识别」。因为在传统的指纹识别中,像指纹膜、假手指等欺骗手段很容易骗过指纹采集设备。因为传统的按压式的指纹设备得到的只是一张黑白的二维图像。而在非接触采集中,我们却可以得到RGB彩色图像。同时,通过对三维手指外在的眩光、时序信号等,可以精确地分析手指的生理和光学性质,从而判断指纹是否来自活体。

未来,打通AIoT和5G场景

CSDN:你如何看待深度学习的发展?

汤林鹏:我认为深度学习取得今天的成绩,跟一批有远见卓识,且孜孜不倦在这个领域上努力研究的人有关,例如神经网络之父Geoffrey Hinton和一些年轻的研究者,他们用很多年的时间来推动这门技术的发展。

此外,深度学习在一开始表现的并不如传统的算法好,是因为它对数据量的要求比较多,但早期的数据量不够。所以想要提升深度学习的性能的前提,需要先建立一个海量的数据集。我在普林斯顿的导师李凯教授和李飞飞教授一起在早期推动了 ImageNet 数据集的建立,也直接促成了2012年以来深度学习发展的浪潮。当然在很多应用中,大规模的数据采集是比较困难的,我们的技术规避了深度学习的这一瓶颈,同时实现了更加精准的视觉信号的搜索。

CSDN:墨奇科技的未来计划是怎样的?

汤林鹏:近期的规划是继续深耕指纹识别领域,并以此为核心建立起下一代的强身份认证平台。未来2~3年,我们希望能够打造通用的、精确的图像搜索技术,并将这些技术应用到AIoT、5G等场景中。但总结起来一句话,我们的核心是希望不断在技术上有所突破,推进 AI 的发展,并以此来撬动更多重要的行业应用。

想了解更多墨奇科技的硬核黑科技?扫码或点击阅读原文免费报名学习哦~

推荐阅读
  • 性能超越最新序列推荐模型,华为诺亚方舟提出记忆增强的图神经网络

  • 阿里云科学家入选计算机顶会HPCA名人堂,他是什么来头?

  • 干货 | 基于SRS直播平台的监控系统之实现思路与过程

  • DevOps 在移动应用程序开发中扮演什么角色?

  • 又一国产数据库诞生!腾讯发布 TGDB,实时查询比 Neo4j 快 20-150 倍!

  • 稳定币经济:十大稳定币简史

你点的每个“在看”,我都认真当成了AI

墨奇科技汤林鹏:如何用 AI 技术颠覆指纹识别?相关推荐

  1. 长寿即服务:创业公司如何用AI技术颠覆传统药物研发

    来源:资本实验室 摘要:未来学家.奇点大学创始彼得·戴曼迪斯(Peter Diamandis)最近就人工智能对新药研发的推动作用进行了讨论,并结合其新近投资的药物研发公司案例,进一步为我们打开了一扇通 ...

  2. 墨奇科技AI+生物识别解决方案亮相安博会;启迈QIMA与世界商品网在供应链管理方面达成战略合作 | 全球TMT...

    报告 全球营销衡量与体验管理平台 AppsFlyer 推出<留存之道:全球应用留存现状基准报告>(2021版).报告指出,iOS 14+正式上线,加剧了全球应用的留存困境,全球各区域.各品 ...

  3. 生物特征识别技术领跑者--墨奇科技 全面亮相2022身份识别技术大会

    国内领先的AI 基础技术和平台公司--墨奇科技与中国国际科技促进会证卡票签专业委员会达成合作. 墨奇科技确认报名参展由多维身份识别与可信认证技术国家工程研究中心,中国国际科技促进会,证件防伪公安部重点 ...

  4. 墨奇科技:生物识别进入可信发展驱动的新阶段

    编辑 | 宋慧 供稿 | 墨奇科技 头图 | 付费下载于视觉中国 在好莱坞电影大片中,经常有"换脸"或者指纹开锁的情节,戏中角色通过"戴上"足以以假乱真的&qu ...

  5. 墨奇科技博客 | 计算机视觉在前端应用中的实践Ⅰ

    墨奇科技在业务中有很多应用需要在网页中对于图像进行处理.特征识别,让我们对于计算机视觉在前端应用中的实践有了一些自己的认识和了解,希望能够借此机会与大家进行分享,尤其是如何搭建基于 WebAssemb ...

  6. 【AI技术】物体识别概述1

    [AI技术]物体识别概述1 1.背景 2.物体识别 3.应用 1.背景 主要针对客户以及初学者概述物体识别. 2.物体识别 物体识别又叫目标识别,物体分类,图像分类,习惯性称为图像分类,即对整张图片进 ...

  7. 墨奇科技博客 | 生物特征密码系统之错误纠正码简介——汉明码

    在传统密码系统中,用户使用密钥对信息进行保护,只有当用户拥有正确的密钥时,才可以解密获得正确的原始信息.因此,密码系统的安全性建立在用户密钥无法被冒充者通过任何手段在合理时间以及合理资源下获得.同时, ...

  8. 旷视科技IPO过会,AI技术“立业”难言轻松

    9月10日消息,旷视科技科创板上市已迈过关键节点.上交所科创板上市委员会已审议通过了旷视科技的首发申请,旷视科技的上市长跑终于迎来曙光. 2019年8月,旷视科技就向香港联交所提交了IPO申请,然而就 ...

  9. 揭秘美国空军如何用AI技术提升“战斗力”

    以AI技术为基础,美国空军正努力将自身转化为更强调协作性的组织. 来源丨Forbes 作者丨Kathleen Walch 编译丨科技行者 通过增加数据规模与相关素养提升,美国空军各部门及人员,将建立起 ...

最新文章

  1. 神经网络中参数量parameters和FLOPs计算
  2. 5天玩转PyTorch深度学习,从GAN到词嵌入都有实例丨教程资源
  3. makefile多目录多文件
  4. java keytool 导入证书_java - Keytool无法导入证书 - SO中文参考 - www.soinside.com
  5. Latex论文排版技巧再总结
  6. Java 8 forEach 示例
  7. RESTful最佳实践
  8. windows编程点滴(一)之Windows获取系统中所有进程
  9. 软件设计是怎样炼成的(6)——打造系统的底蕴(数据库设计)(下篇)
  10. Atitit db model 数据库快速建模法 开发效率 目录 1. 结构(数据)设计 行为(处理)设计: 1 2. 业务建模阶段 1 2.1. Ui建模法,根据表单字段建立表字段 2 2.2.
  11. mysql同步三张表如何用事务_MySql-第三部分(外键, 多表连接, 事务,视图 )
  12. IM即时通讯项目讲解(二)--自定义实现图片选择GalleryView
  13. 漂亮html表格页面模板,四款好看实用的CSS表格样式分享
  14. Oracle cmd sqlplus 命令
  15. NATAPP内网穿透使用
  16. 5G移动通信发展历程
  17. 【数学和算法】加权平均法
  18. 阿里云大幅降低CDN价格网宿蓝汛跟不跟?
  19. vb.net 设置默认打印机
  20. 小达同学软件测试第三讲

热门文章

  1. 【No.1_sizeof与strlen】
  2. 《JavaScript设计模式》——11.2 一切只因跨域
  3. 区域链实践第一步——区域链测试环境搭建
  4. 注意!Linux glibc再曝漏洞,可导致Linux软件劫持
  5. linux修正系统错误指令fsck和badblocks
  6. 关于StartCoroutine的简单线程使用
  7. ASP.net 2.0中水晶报表迁移部署问题
  8. 面试官:如何实现一个高性能的,短链接生成服务?(附源码)
  9. 多传感器融合(算法)综述
  10. for循环 lamda python_Python中if-else判断语句、while循环语句以及for循环语句的使用...