导读

最近研究课题基本锁定在动物脸部及行为识别,看到一个比较有意思的课题方向,如果有兴趣可以搞一搞,在知网的论文搜索引擎上也属于独树一炽。话不多说,看图行事,下图是论文情况。

你一定听过人脸识别,但是你听过猴脸识别么?研究猴脸识别能干吗?难不成分辨真假美猴王?我们知道猴子和人类都属于灵长类动物,那可否用人脸识别的方法去识别猴子?然而,猴子生长在野外,且天生好动,又该如何获取猴子的影像呢?黄河连线带着这些疑问,特此专访了西安电子科技大学苗启广教授,苗启广教授是计算机视觉方面的专家,在猴脸识别领域有着深入的研究和实践基础。

1.黄河连线:非常感谢苗教授能接受黄河连线的专访,提到人脸识别大家可能还会比较熟悉,那提到猴脸识别让人感觉会很兴奋,但是感觉离我们的现实应用比较远,当时为什么会有这样的想法呢?
苗启广:金丝猴是国家一级保护动物,对其进行保护的重要性是不言而喻的。对金丝猴进行保护,就要了解它的个体和群体的习性,活动规律,生存状态以及社会群体的组织结构等。那么在此过程中,首要的任务就是个体识别。只有认识了每一个个体,才能进一步研究群体规模,社会结构等。

陕西有一个金丝猴保护区,首先,对动物饲养员来说,金丝猴具体有多少只,只能知道大概,那对金丝猴的保护是一个难题。其次,很多学校经常做金丝猴的动物实验,相关专业的学生需要到山上观察金丝猴的行为,往往蹲点观察1—2个月才能把金丝猴分别开来,然后进行正式工作,这样就很浪费时间。

对于金丝猴的个体识别,传统的方法就是采用人工标记或者是“照片相面”。人工标记方法指的是在金丝猴身体的某个部分打上标签,这种方法存在较大的局限性,随着金丝猴的成长会对金丝猴的身体造成一定的伤害,这也就违背了我们保护金丝猴的初衷。而“照片相面”方法其实就是人工记忆,这种方法很大程度上受限于个人经验,并且当群体规模较大时,人工记忆难度较大,极易产生相互混淆的情况,此外,人脑还存在遗忘的问题。为解决这些问题,又鉴于目前机器学习方法,特别是近年来深度学习方法在人脸识别方面取得辉煌成果,希望能够利用计算机视觉技术实现金丝猴的个体识别。这些工作,都是我和我的已经毕业的博士生许鹏飞博士共同做出的研究成果。

就目前的研究进展,利用金丝猴的面部特征进行个体识别是完全可行的。猴脸识别是通过拍照或者录像的方式获取图片数据,然后由计算机执行相应算法实现个体识别。这种方法不会对金丝猴产生任何伤害,也不会影响他们的活动规律,完全是一种非接触式的监测方式。

此外,拍照或录像可以长时间持续(这里指的是每天,每月,每年等等)进行,这样就可以持续记录每只金丝猴的“相貌”,并且计算机不存在人脑遗忘的情况。我们做的种种努力都是为了能够利用计算机视觉技术实现复杂情况下对金丝猴进行个体识别,这些研究成果将为后期对金丝猴个体的行为监控、群体生存状态检测和活动规律的研究奠定基础,进而为金丝猴保护政策和措施的制定提供更可靠的依据。

2.黄河连线:这需要解决哪些难点?
苗启广:猴脸识别需要解决的第一个难题就是建立猴脸数据库。与人脸识别一样,猴脸识别也需要首先建立一个猴脸数据库。但相对于人脸数据库,猴脸图像的获取存在更大难度。主要原因在于,我们无法让动物按照我们的意愿来接受我们对其进行拍摄,更多情况下是我们主动寻找机会去捕获他们的面部图像

此外,金丝猴获得的场景较为复杂,特别是野生金丝猴,拍摄时会受到多种因素的影响。例如:

■ 野外环境的复杂性和不可控制性。金丝猴生活在野外环境,不同季节的野外环境存在巨大差异。并且,全球金丝猴分布区域广泛,不同国家、不同区域的金丝猴所栖息的野外环境也存在较大差异。

■ 布置在野外的红外相机或者可见光相机的位置和角度都是固定的,在面临各种环境光照的考验时,可能出现侧光、背光和高光等现象,同时还会出现各个时段光照不同的现象。

过去差不多一年的时间我们都在摸索如何能够快速有效地拍摄到金丝猴面部图像数据的方法。为了能够拍摄到有效的猴脸图像,我们经过多次拍摄实践,制定了相应的拍摄策略和方法,同时对拍摄设备和相关参数也进行了相关设置。目前我们已经捕获有220多只金丝猴的面部图像共计有30000余幅。

由于金丝猴面部特征的相似性和易变性,相同年龄阶段的不同金丝猴个体在其头部形状、面部结构、器官外形、头部毛发的颜色和纹理等方面都非常相似。这也就对识别算法的性能提高了更高的要求。此外,与人类相似,金丝猴也可以通过面部的变化产生多种表情,这些表情导致了其面部形状特征和纹理特征的不稳定。如果在野外环境下,金丝猴面部可能受到树枝、树叶等事物的遮挡,或者其面部粘有污泥等,这都会导致金丝猴面部特征的发生变化。由面部表情变化以及其他环境因素的变化所引入的非线性因素是金丝猴面部特征识别过程中需要解决的一个难题。

3.黄河连线:我们可以经常听到人脸识别,而且猴子和人类都属于灵长类动物,那么猴脸识别的原理与人脸识别类似么?是什么原理?

苗启广:金丝猴的面部特征和人脸的面部特征存在一定的相似之处,但同时也存在较大的差异,主要表现在面部结构和面部的纹理。当我们初次听说或看到猴脸识别时,多数人的直观的想法就是利用现有的人脸识别方法进行猴脸识别。而人脸特征和动物面部特征之间存在较大差异,如果将现有的人脸检测和识别方法直接应用于动物面部检测与识别会产生一系列问题。

虽然金丝猴面部特征与人脸特征之间存在一定的相似之处,但在面部结构、器官形状和面部纹理特征等诸多方面存在较大差异,主要体现在三个方面:

■ 第一,相对于人脸,金丝猴面部由毛发和皮肤两个部分组成;

■ 第二,金丝猴的面部(特别是面部毛发区域)具有更复杂的纹理特征;

■ 第三,相对于人脸特征的全局相似性,金丝猴面部特征具有显著的局部差异性。

因此,针对金丝猴面部图像的检测与识别,不能直接采用现有的人脸检测与识别的方法。

基于深度学习的猴脸识别的基本原理其实是和人脸识别类似的,也就是利用深度学习算法提取金丝猴面部的有效特征,进而对其进行更有效的个体识别。但是我们不能直接使用现有的人脸识别的方法进行猴脸识别,我们需要根据具体的任务,对算法模型进行相应的改进,使其更适合于猴脸识别任务。

4.黄河连线:与人脸识别相比,猴脸识别的难度如何?精确度如何?

苗启广:相对于人脸识别,猴脸识别还是存在一定难度的,除了上边提到的环境复杂,面部角度和形态多样性之外,还有就是猴脸的相似性。相对于人脸,猴脸识别就类似于“多胞胎”的识别,相同年龄阶段同一性别的金丝猴的长相非常相似,人类仅凭视觉难以准确识别,这也给我们设计猴脸识别算法提出了较高的要求,也就是如何能够提取出长相相似的不同金丝猴个体面部的差异性特征,以及同一金丝猴个体在不同因素影响下面部的相似性特征。

好在目前具有多隐层的人工神经网络有着优异的特征学习能力,学习到的特征对数据有着更本质的刻画,更有利于对金丝猴个体的识别。相比于一些传统的学习方法,在精度上,有了很大的提高。目前已经对197只金丝猴进行了识别,识别准确率在97%以上,包括秦岭皇冠朝阳沟保护区的23只金丝猴,佛坪熊猫谷的48只金丝猴和周至的126只金丝猴。

5.黄河连线:猴子的活跃度远高于人,且不受控制,能否顺利识别?在技术上有什么解决办法?

苗启广:在野外,猴子的活跃度高,不受控制,但是事实上我们并不需要和猴子近距离接触,只需要拍摄记录下猴子的照片或视频即可,在图像或视频帧中猴脸分辨率在100×100左右,且不存在运动模糊和大面积遮挡,就可以进行识别。目前常用的有200万像素的智能手机就可以满足要求,当然单反相机就更好了。因此,获取猴脸图像在设备上不存在问题。而主要的问题在于如何能够拍到侧脸角度较小,也就是小于30°的侧脸,没有大面积遮挡的猴脸。对于不听指令,活跃度很高的金丝猴,这一任务具有较大的挑战。

在单个人拍摄的情况下,我们总结了相应的拍摄策略和参数要求,并且形成了相应的规范。目前我们在进行多物种动物拍摄过程中,基本都是按照这一规范进行的。我们可以在已拍摄的图像和视频中实现金丝猴面部的检测与识别,并且已经实现了基于浅层ResNet模型的金丝猴面部识别的实用软件,这个软件运行在基于Tegra K1的Jetson TK1嵌入式系统开发平台上。

而在后期,我们将会尝试多摄像头组合的方式(即布置摄像头点阵),这样就可以在不同方向对金丝猴进行拍摄,就能够很大程度上拍摄到他们的有效面部图像。进一步,再进行视频拼接,三维建模等研究,以更好地实现在大场景下对金丝猴进行面部检测、识别与追踪。

6.黄河连线:那猴脸识别在现实中会起到什么作用?

苗启广:在金丝猴保护和动物、生态研究方面,解决了研究人员需要对金丝猴个体进行人工记忆的难题,为他们更准确地计算群体规模提供了可靠数据。并且,我们后期的主要任务就是实现在复杂的野外背景下对金丝猴进行快速检测与追踪,为金丝猴个体和群体行为规律大研究奠定基础。这样可以让动物研究人员能够更好、更深入地了解金丝猴个体和群体行为。

对于计算机视觉研究方面,拓展了计算机视觉的应用范围,实现了计算机视觉技术的跨学科应用,同时,针对新的问题,对传统机器学习和深度学习方法进行了相应的改进,提高了算法的精度和速度。

此外,这种技术还可以应用于野生动物新个体的发现。如果金丝猴种群中,存在新加入的个体或者家庭,那么我们的算法可以准确识别,并及时将相应个体的图像数据加入数据库。如果后期这种技术能够应用于大熊猫等其他动物的识别中,那么对于野生大熊猫或者其他珍惜动物数量的调研将起到重要的有利作用。

7.黄河连线:猴脸识别的应用场景有哪些?市场需求是否足够大?

苗启广:目前,金丝猴脸部识别可以应用到以下几个方面:

■ 对动物科研人员来说,可以使他们更容易,更准确地获得动物个体的身份,以及个体和群体行为等信息。

■ 对动物园来说,可以利用这种技术实时监测不同动物群体和个体在笼舍中的情况,为科学饲养提供依据。

■ 对游客来说,随着旅游业的兴起,越来越多的人前往动物园或野生动物保护区,但是多数游客只是看看动物的种类,不同种类动物的长相,或者看下那些动物是不是比较可爱,而很少了解动物的个体和群体的关系或者相关行为规律。那么我们可以将猴脸识别应用到对金丝猴以及对动物园中其他动物的个体识别中,我们用手机拍下一只金丝猴或者其他动物的图像,通过算法进行个体识别,然后给游客返回这只金丝猴或其他动物的很多信息,比如:它的名字,年龄,甚至家庭成员,这也增加了游客游玩的乐趣,了解了很多动物的相关知识,也在一定程度上促进了人类保护动物的意识。

面部识别:猴脸识别如何分辨真假 “美猴王”?相关推荐

  1. 西北大学发布猴脸识别论文,公开 10 种动物面部数据集

    内容提要:在人脸识别日趋成熟的今天,研究人员已经开始将这一技术扩展到动物研究中.最近,西北大学 研究团队提出的「猴脸识别技术」,不仅能识别出金丝猴,还能具体到是哪只猴.这对于金丝猴的保护有着重要意义. ...

  2. 西北大学研发猴脸识别技术;小米造车未立项;Linux Mint 警告用户安全意识落后 | 极客头条...

    「极客头条」-- 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧. 整理 | 丁恩华 出品 | CSDN(ID:CSDNnews ...

  3. 论文阅读笔记(五)——狐猴识别系统:一种便于狐猴个体识别的面部识别系统

    论文阅读笔记(五)--狐猴识别系统:一种便于狐猴个体识别的面部识别系统 论文简介 论文中文翻译:狐猴识别系统:一种便于狐猴个体识别的面部识别系统 论文名称:<LemurFaceID: a fac ...

  4. 冠军奖30万!刘强东搞了个“猪脸识别”比赛,中美两地同时启动(附比赛详细日程及赛题说明)

    编辑 | Katerina Donna 润色 | 鸽子 11月6日,由京东金融与红杉资本联合主办的首届"JDD-2017京东金融全球数据探索者大会"在751大罐举行,同时,大会宣布 ...

  5. 汪星人出门也靠脸?狗脸识别技术可识别化妆后的汪星人,准确率99%

    来源:新智元 本文约2000字,建议阅读5分钟. 人脸识别技术正如火如荼地开展,狗脸识别技术也不甘落后. [ 导读 ]从人脸识别到狗脸识别,图像识别技术正如火如荼地开展.近日,支付宝开放了" ...

  6. 分辨真假数据科学家的20个问题及回答

    [导语]本文分为两个部分,第一部分是quora上很火的一篇问答--[20个分辨真假数据科学家的问题]中赞赏数最高的回答,第二部分则是KDnuggets阅读量非常高的一篇文章[KDnuggets编辑们针 ...

  7. 缺货大环境下,假货防不胜防,我们又该怎样分辨真假芯片?

    猛男如何学嵌入式,关注@我要学嵌入式,嵌入式男人的加油站. 摘要:在全球半导体缺货行情下,假芯片开始在供应链流通.全球芯片短缺为假芯片进入市场创造黄金窗口,给更多的电子产品带来质量风险,损害整机厂商和 ...

  8. Python实现猫脸识别 | 喵主子福利

    点击关注我哦 一篇文章带你了解Python实现猫脸识别 本文将向您展示如何编写一个简单的猫脸检测程序.在程序中同时结合了人脸和猫脸的检测模型,让机器学会区分人和猫.这听起来就像是非常有趣的一个项目~ ...

  9. 猪脸识别?!阿里和京东这次要AI养猪了

    击上方"码农突围",马上关注,每天早上8:50准时推送 真爱,请置顶或星标 提到养猪,你会想到什么?一个偏远的乡村,农民辛勤的劳作,数百头猪圈养在猪圈中,吃了睡睡了吃,不断生长,不 ...

最新文章

  1. 9550电机_电机转矩与性能的关系
  2. 命令行里给个注释,AI就能自动生成代码
  3. 电脑换ip软件_为什么会有企业需要软件换IP?
  4. Adapter(适配器)--类对象结构型模式
  5. 玩Azkaban跳过的坑
  6. 动态规划经典题目_动态规划经典题目:鸡蛋掉落(附视频讲解)
  7. paypal php txn id,php 接入 paypal 支付
  8. 5、使用Libgdx设计一个简单的游戏------雨滴
  9. js 多个定时器_《进击的前端工程师》Node.js事件循环
  10. 基于genius框架的智能代理(intelligence agent)在IDE平台上的编辑
  11. NOIP2013 复盘
  12. sg90舵机c语言编程,浅谈用单片机控制SG90舵机(原理+编程)
  13. 路由交换复习选择题题库
  14. 【IDE】IAR for ARM官网下载链接(超级全,什么版本都有——找不到来打我)
  15. 带你深入剖析TCP/IP协议、TCP协议和UDP协议、IP协议
  16. 解决网易云音乐ubuntu客户端播放中无声音
  17. excel中添加有效性验证或数据验证时不选择第一行列标题的解决方法
  18. 一张30年前的大学排行榜!
  19. 2020-05-12
  20. sysvinit源码分析 Linux-init-process-analyse

热门文章

  1. 安装免费360随身wifi一键创建WiFi热点让电脑与手机共享wifi无线网
  2. 4年外包终上岸,我只能说这类公司能不去就不去
  3. 软件测试线上故障规范及模板
  4. 给你心爱的 npm 包上个『北京户口』
  5. 推荐收藏系列:一文理解JVM虚拟机(内存、垃圾回收、性能优化)解决面试中遇到问题(图解版)
  6. 保研夏令营-南大、哈工、天大、中山、北理
  7. js生成二维码——QRCode.js中文文档
  8. Apache Hadoop YARN:另一个资源协调者
  9. 地图可视化工具有哪些,基于地图的数据可视化软件
  10. 在自己项目或者 vue 中使用可爱的二次元((Live2D)