从以往的人脸识别的学习中,知道目前对于机器而言,他们无法做对于夸张的人脸肖像进行识别。最近读到了一篇关于人脸肖像的识别问题,来了兴趣。

话不多话,漫画想必大家都应该看过,就算是同一个人也会有不同风格的肖像漫画图。如下所示。




从上面的四张图片中可以看出,不同风格的肖像图能够突出不同的人脸部分的特征。

对于这种类型的人脸肖像图,人能够比较容易辨认出该图片属于哪个人,但是对于机器而言,则具有一定的挑战性。麻省理工学院视觉研究实验室分析由几十名艺术家创作的数百幅肖像漫画,从而找到那些对于面孔识别最为重要的面部比例。上图显示了部分关键的面孔识别参数,比如两个瞳孔之间的距离;下嘴唇到下巴之间的距离;额头的面积等等。
人脸识别是人类比较擅长的技能之一,那么如何让机器也能够获得同样的能力?答案也可可以从漫画中获得。漫画的特点是放大人物的某些显著特征,但有种说法,好的漫画甚至比照片更像本人。因为它抓住了大脑捕捉的关键面部特征。那么有哪些特征是识别面孔的关键呢?
我们的大脑是灵敏到令人惊奇的机器,而识别面孔可能是它最擅长的。在出生几小时后,新生儿的眼睛就被类似面孔的图形所吸引。成年人的大脑只需100毫秒就能判断它看到的是一张面孔,只需要1秒多一点的时间就能识别两张光照条件、角度完全不同的面部照片。神经学家认为在人脑中有一个特别的区域———颞叶梭状回———专门用于面孔识别。
或许,最能说明我们出色的面孔识别能力的当属漫画,哪怕是在几秒钟内勾勒出线条简单人物漫画,也能轻易被我们的大脑识别。人们说,好的漫画比照片更像本人。虽然听上去不可思议,但这一点确实得到研究的证实。在视觉科学领域甚至有一个形容这一现象的专业名词———漫画效应。
人的面孔大同小异:嘴巴上一个鼻子,再上面是两个眼睛,人与人之间的面部特征差别通常只有几毫米。因此,我们的大脑重点寻找的是显著特征,也就是和我们头脑中的理想面孔(我们所见过的所有面孔的平均值)差异最大的地方。换句话说,为了击败视觉专家所谓的雷同问题,我们强调最重要的特征,忽略次要特征。我们对面孔的认知专注于朝天鼻、凹陷的眼睛或是肉乎乎的脸颊,在头脑中将它们夸大。为了识别并记住别人,我们把他们的面孔变成了漫画。
面孔识别科学原本只是人工智能领域一个停滞不前的课题,十年前突然成了事关国家安全的大事。9·11主谋穆罕默德·阿塔经过波特兰机场时被监控录像拍下的模糊画面让美国公众震怒,深受刺激的政客们纷纷拨款资助自动面孔识别系统的研究。人们都以为,几年之内,当所有监控摄像头都配备面孔识别软件后,人群中的每张面孔都会无比突出,它们将像独一无二的指纹一样立刻和嫌疑犯数据库进行对比。
是否听说有一个视觉科学家只用漫画家做实验对象?麻省理工学院视觉研究实验室主任帕万·辛纳是全美最前卫的电脑视觉研究者之一,他深知幽默、古怪、夸张是漫画的本质。他自己偶尔也为学校刊物创作漫画。但辛纳也认为,这些简单的、夸张的画作能够被客观地系统地研究,并帮助揭示人类和机器视觉的秘密。今年,他的实验室准备用计算机分析几十位漫画家创作的几百幅漫画,希望从中找到漫画家们的直觉知识———对于面孔识别,什么特征是最重要的,什么不重要。他将这个工作命名为赫尔希菲尔德计划,得名于著名的《纽约时报》漫画家阿尔·赫尔希菲尔德。
简单地说,赫尔希菲尔德计划逆向分析漫画家的创作过程。通过分析漫画,辛纳希望找到那些反复出现的夸张部分。他认为,最终将得到20多种对于面部识别最为重要的面部特征,以及它们各自的重要程度。辛纳说,“这将是揭开面孔密码的配方。”在初步实验中,实验室已经分离出一些重要元素———比如,鼻子根部与嘴巴的距离和前额高度之比。辛纳决定将它们命名为赫尔希菲尔德特征。
在任意一张面孔上,和标准面孔相比,20种赫尔希菲尔德特征中有4个的值偏大。在另一张面孔上,可能是另外几个特征大于平均值。但是无论在哪种情况下,关键都在于抓住夸大的部分。今天的现实是,自动面孔识别系统必须将目标面孔和视频中几百万张不停在运动的面孔进行比较。但是,迄今为止,面对种种目不暇接的变数,软件不知道到底该比较什么。通过赫尔希菲尔德特征,辛纳希望计算机能关注那些对于面孔识别最为重要的特征,排除其他干扰因素。

17.4.17 漫画与人脸识别(一)相关推荐

  1. 17.4.17 漫画与人脸识别(二) WebCaricature: a benchmark for caricature face recognition 小感

    最近在读<WebCaricature: a benchmark for caricature face recognition>. 本文主要有是三个贡献. 提出了一个新的漫画数据库.数据库 ...

  2. CVPR 2020 | 腾讯优图17篇论文入选,含类比学习、人脸识别、物体检测、行人重识别等领域...

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 本文来源:腾讯优图 全球计算机视觉顶级会议CVPR2020  (IEEE Conf ...

  3. OpenCV-Python实战(17)——人脸识别详解

    OpenCV-Python实战(17)--人脸识别详解 0. 前言 1. 人脸识别简介 2. 使用 OpenCV 进行人脸识别 2.1 使用 OpenCV 进行人脸识别流程示例 3. 使用 dlib ...

  4. 莫斯科计划在 17 万个监控摄像头中引入人脸识别;广东农行“刷脸取款”实现 1600 多个网点全覆盖...

    四川省第二中医医院"智慧中医"平台上线 通过"智慧中医"平台,医护人员查房时,手持"智慧终端",利用平台大数据共享可为患者提供更加优质的健康 ...

  5. opencv贾老师系列17——人脸识别实战

    均值方差和协方差 计算协方差矩阵 需要对称矩阵才可以用: PCA原理(用于降维) 人脸识别算法之EigenFace 测试图像的大小要相同: N*N变为一个N的平方的矩阵,从二维变成一维,再求这个矩阵的 ...

  6. 南京大学发布WebCaricature漫画人脸识别数据集

    近日,南京大学推理与学习研究组(R&L Group)发布了一个新的漫画人脸识别数据集 WebCaricature.该数据集包含了 252 个名人的 6042 幅漫画图像以及 5974 幅人脸图 ...

  7. 人脸识别以及漫画效果处理

    人脸识别以及图像处理软件简要说明 点击"人脸检测图标",进入软件主界面如下: 程序中内置了一张测试图像,也可以加载手机中存储的人脸图像.下面简单介绍下软件功能; (1)通过调节羽化 ...

  8. 人脸识别数据集精粹(上)

    人脸识别数据集精粹(上) 人脸识别 人脸检测和关键点检测都是比较底层的任务,而人脸识别是更高层的任务,它就是要识别出检测出来的人脸是谁,完成身份比对等任务,也是人脸领域里被研究最多的任务. 1.1 人 ...

  9. 深度人脸识别:CVPR2020论文要点

    深度人脸识别:CVPR2020论文要点 Towards Universal Representation Learning for Deep Face Recognition 论文链接:https:/ ...

最新文章

  1. Java高阶部分知识点汇总(三)-基本类型的包装类详讲
  2. 如何写一篇酷炫的博文(博文列表中展现字幕)
  3. Lamp的搭建--centos6.5下安装mysql
  4. AngularJS 的常用特性(二)
  5. qt使用样式表来设置不规则按钮
  6. apk ionic 破损_ionic3-android打包完美解决
  7. HTML+CSS实现个人简历
  8. java jdk9_jdk9下载-jdk9下载9.0.4 官方最新版-西西软件下载
  9. 64 ---- 平面与直线的位置关系
  10. Saved Blogs
  11. 16进制在计算机上显示,16进制计算器(16进制计算器安卓版)
  12. RAR及ZIP压缩文件解压提示文件损坏或无法解压原因及修复办法全解析
  13. linux7 (RHEL7.5)超详细系统安装步骤
  14. QT打包应用程序文件步骤
  15. 又一个IGame的bug
  16. 电子元器件行业SRM供应商系统加强产业链协同,保证零差错高效率
  17. 开机显示输入最佳预设值_电脑显示输入最佳预设值并重新开机是什么意思
  18. 垃圾回收器判断对象是否存活
  19. 深度相机原理揭秘之3D结构光Sensor(iPhone X、小米8探索版、OPPO Find)
  20. js第三章简答题5(制作如图所示的Tab切换效果)

热门文章

  1. python能制作ppt动画效果吗_我可以用Python制作动画吗?
  2. 西门子SMART 200 modbus rtu通讯宇电温控器例程
  3. 西门子SMART 200 modbus rtu通讯宇电温控器例程 运行/停止的控制及指示;温度设定,上下限报警设定
  4. mysql 显示表情符号_mysql 支持emoji 表情字符的解决方法。
  5. 如何让ipad成为电脑的扩展屏
  6. sparc-linux-gcc math.h 调用,无法使用叮进行交叉编译为SPARC
  7. ThuThesis模板中\footnote每页重新从2编号的问题解决
  8. 企业风险管理的四种模式五种策略分别是什么?
  9. 财务自由之路 读书笔记 第六章 债务
  10. HIVE最全面入门指南