笔者是从传统图像算法开始进入计算机视觉行业的,那一批人基本上都是从人脸图像和文本图像开始学,而如今很多计算机视觉从业者却从来没有接触过人脸图像相关的算法,或许真的是时代变了吧。

但笔者想说的是,如果你想快速系统地串联计算机视觉领域的知识,人脸图像应该是唯一选择,没有其他类型的图像可以覆盖底层图像特征,目标检测与跟踪,图像分类和检索,图像滤波,图像分割,三维重建,风格迁移等方向,并且能够做到相互融合从而进行工业界落地。如果你还不知道人脸图像能做什么,不如看一看上面的1分钟视频,然后我们接下来细看到底都有些什么。

底层图像特征

或许很多经典的底层图像特征已经PK不过现在的深度学习模型学习到的特征,但是思想是永恒的,在人脸这个领域,有一些特征理解起来非常直观。

特征通常可以分为颜色特征、纹理特征、形状特征,下面我们看看在人脸方向有哪些很经典的东西。

第一个是肤色高斯模型,它是颜色特征。尽管人有白、黄、黑三种肤色,但研究证明,肤色在某些颜色空间上的差异性主要体现在亮度上,在色度上具有较好的聚类表现。因此根据肤色属性所具有的规律和分布情况对肤色建模,便可以将肤色与非肤色区域区分开。肤色高斯模型在早期可以常用人脸检测,现在也常用于辅助一些模型进行人脸区域的快速定位。

第二个是haar特征,它是纹理特征。脸部有一些固有的属性,比如眼睛要比脸颊颜色要深,鼻梁两侧比鼻梁颜色要深,嘴巴比周围颜色要深等。Haar特征通过对相邻图像块进行灰度比较,并使用积分图像进行快速计算,在大名鼎鼎的V-J算法中被使用。如果研究过OpenCV人脸检测算法的,不可能不知道。

第三个是形状特征,基于人脸特征关键点就可以计算出一系列的形状特征,因为人脸关键点是眉毛、眼睛、鼻子、嘴巴、脸部等有语义的特征点,每个人脸都通用却有独特性,对于光照姿态等有很强的不变性。

目标检测与跟踪

目标检测可以说是计算机视觉方向中从业者最多的了,不然也不会出现千篇一律的简历中写着跑过Yolo算法,人脸检测就是目标检测的一个子领域。

尽管通用的目标检测算法可以用于人脸检测,但是人脸检测依然有它的特点,比如早期的时候一些方法会挨个检测人脸的各个部位,然后组合成最终人脸。以MTCNN为代表的框架会把人脸检测和关键点检测问题进行联合处理。

而如今,在目标检测领域中的一些难题在人脸检测领域同样广泛存在,比如大姿态人脸、遮挡人脸、模糊小脸,甚至是伪造人脸,搞明白了人脸检测,目标检测还会是问题吗?

另一方面,工业界应用的时候不仅要做检测,还需要做跟踪平滑,此时常常需要应用卡尔曼滤波等传统算法,而不仅仅是一个模型就能搞定,更复杂完整的项目,才能更好地锻炼能力。

图像分类和检索

没有人不知道图像分类问题,而为我们所熟悉的人脸识别系统,其中一条典型的技术路线就是图像分类+验证+检索模型的组合

以上图DeepFace为例,它首先对输入人脸经过3D对齐,然后使用数据集训练一个人脸分类器得到人脸特征提取网络,最后使用Siamese网络训练人脸验证网络。这样一来,就解决了人脸特征的问题,即将高维的人脸表达成了一个低维的特征,接下来就是进行人脸的聚类与检索。

如今人脸识别系统虽然已经大规模商业化,但并不意味着这里面就没有事情可以做了。遮挡人脸识别,跨姿态人脸识别,跨年龄人脸识别,妆造不变人脸识别,光照不变人脸识别,少样本人脸识别,3D人脸识别,视频人脸识别等都是现实存在的难题。

解决上面这些问题,不仅需要新的技术,也需要对分类检索等老技术的改进。

图像滤波

图像滤波是一类很底层的图像处理方法,在图像降噪,图像去模糊,图像修复等底层图像处理领域中是核心技术。那么在人脸图像中,又用在了哪里呢?大家或许不知道技术,但是不可能没有接触过,那就是人像美颜,熟的不能在熟的磨皮美白大法。

其中常见的方法包括均值滤波,双边滤波,引导滤波,以及针对这些方法的改进。掌握了核心技术,从人脸美颜迁移到其他的图像增强领域,就很自然了。

三维重建

三维重建即3D Reconstruction,在计算机视觉中,三维重建是指根据单视图或者多视图的图像重建三维信息的过程,通常需要从二维的图像投影恢复出物体的三维形状和纹理信息,这是接下来计算机视觉会取得突破的重点领域,而人脸的三维重建问题,实在是太典型了。

从基于单张图的3DMM等人脸通用模型与Shape from Shading(SfS)等优化方法,到基于多张图的立体视觉,基于视频的Structure from Motion(SfM),端到端的与端到端的模型,传统的与深度学习方法,这个领域涉及的算法非常多,而且难度较高。

另外,如何逼真地重建出人脸的细节信息,如何在二维的人脸被遮挡后还能进行重建,都是当前人脸重建领域要解决的难题,研究起来有足够的技术深度,一旦攻克也有大量商用场景。

另外3D与图形学有非常紧密的联系,使得这些技术在内容创作上有非常大的商业价值,难道你不想加入其中吗?

图像编辑与风格化

随着生成对抗网络等技术的发展,当前图像编辑与风格化正在成为计算机视觉领域的新热点,其中尤其是人脸图像落地能力最强,在人机交互,娱乐社交,内容创作等领域应用非常广泛。

从人脸年龄编辑、人脸卡通头像生成、换脸等全局性质的编辑,到人脸表情编辑,人脸发型,人脸化妆去妆等局部性质等编辑,几乎覆盖了图像编辑与风格化的所有关键技术。当前交互式,可控的编辑模型也是研究重点。

怎么规划学习路线

上面说了这么多,无非就是想告诉大家,作为打算长期在计算机视觉有所建树的同学,人脸图像是非常值得研究的,也是不可能绕过的,那么如何长期学习相关知识呢?下面介绍我们的两个内容。

(1) 2020年7月,有三的新书《深度学习之人脸图像处理:核心算法与案例实践》在机械工业出版社出版,这是一本讲述在人脸各个方向中的深度学习算法的书籍,同时配套有大量实战案例。

言有三新书来袭,业界首次深入全面讲解深度学习人脸图像算法

书中各章节内容如下:

第1章 人脸图像和特征基础

第2章 深度学习基础

第3章 人脸数据集

第4章 人脸检测

第5章 人脸关键点检测

第6章 人脸识别

第7章 人脸属性识别

第8章 人脸属性分割

第9章 人脸美颜和美妆

第10章 人脸三维重建

第11章 人脸属性编辑

这是市面上唯一一本将人脸各领域这几年的核心算法讲清楚的书,而且在可预见的几年内都可能如此。

(2) 有三AI秋季划人脸算法组和GAN组,这是集教材,图文代码实践,视频课程和直播,知识星球社区,线上微信群,线下活动为一体的终身有效学习小组,详细可以阅读以下文章。

【通知】如何让你的2020年秋招CV项目经历更加硬核,可深入学习有三秋季划4大领域32个方向

最后总结一句,人脸图像算法领域,技术成熟,又有许多需要长期研究的内容,学习它,难道不香吗?

往期相关

  • 【技术综述】基于3DMM的三维人脸重建技术总结

  • 【技术综述】人脸妆造迁移核心技术总结

  • 【技术综述】人脸风格化核心技术与数据集总结

  • 【总结】最全1.5万字长文解读7大方向人脸数据集v2.0版,搞计算机视觉怎能不懂人脸

  • 【技术综述】人脸年龄估计研究现状

  • 【技术综述】人脸表情识别研究

  • 【技术综述】人脸颜值研究综述

  • 【技术综述】人脸脸型分类研究现状

【杂谈】如果你想快速系统掌握计算机视觉大部分领域,学习人脸图像是唯一选择...相关推荐

  1. 云计算具有哪些优势 如何快速系统学习云计算

    云计算具有哪些优势?如何快速系统学习云计算?近年来,云计算发展迅猛,同时随着大数据.人工智能等研究的不断深入,云计算作为其重要技术和支撑,未来仍会有巨大的发展空间.下面一同来看看吧. 云计算是一种按使 ...

  2. 独家 | 如何为计算机视觉和深度学习安置英伟达?

    作者:Sangeet Aggarwal 翻译:王晓颖 校对:张若楠 本文约10000字,建议阅读10+分钟 本文教你如何使用 Tensor Flow,Keras,Tensor RT,以及OpenCV来 ...

  3. 想成为优秀UI设计师 如何系统地学习UI设计

    想成为优秀UI设计师 如何系统地学习UI设计?由于就业市场竞争激烈,很多大学毕业生就业困难,而很多刚毕业工作一段时间的人,也因为能力和专业不能在重要岗位上任职,没有更好的发展前景. 随着互联网的发展, ...

  4. 《智能步态识别门禁系统》,基于深度学习的多人步态识别系统

    本文章仅仅提供一种自认为比较科学的方式去实现多人步态识别,如果对多人步态识别感兴趣,却又不知道如何实现的话,这篇文章将会有莫大的帮助.以下方法作者皆实验过是可行的方案.(训练集124人,准确率96%, ...

  5. 想快速重构智慧园区5A系统,这份方案推荐给你

    本文分享自华为云社区<HDC.Cloud 2021 | 想快速重构智慧园区5A系统,这份方案推荐给你>,原文作者:华为云头条. 近年来,园区的数字化一直在演进,从OA.CA.BA.SA.F ...

  6. 2.3 快速搭建你的第一个系统,并进行迭代-深度学习第三课《结构化机器学习项目》-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 2.2 清除标注错误的数据 回到目录 2.4 在不同的划分上进行训练并测试 快速搭建你的第一个系统,并进行迭代 (Build Your First System Quickl ...

  7. 印象笔记mac版 同步问题_【杂谈】想成为机器学习学霸?先学会做笔记吧(Evernote,BoostNote,Leanote等)...

    今天聊聊记笔记这件事儿,在学习的过程中做好总结记录是非常重要的. 作者 | 小满&有三 编辑 | 小满&有三 <人类简史>有一个有趣的现象描写:远古时期的智人是看什么就吃什 ...

  8. 想染指系统架构?看这篇就够了

    https://juejin.im/post/58f45b058d6d8100648a69f0 原文地址:github.com/donnemartin/system-design-primer 译文出 ...

  9. 想染指系统架构?你绝对不可错过的一篇

    本文讲的是想染指系统架构?你绝对不可错过的一篇., 系统设计入门 翻译 有兴趣参与翻译? 以下是正在进行中的翻译: 巴西葡萄牙语 简体中文(已完成) 土耳其语 目的 学习如何设计大型系统. 为系统设计 ...

最新文章

  1. Citrix运行检测出错
  2. 李永乐线性代数2020年强化课手写笔记汇总
  3. mysql查看已打开文件数_MySQL如何计算打开文件数_MySQL
  4. Java扩展机制可加载所有JAR
  5. Java文件合并变得语义化
  6. 华为p20pro投屏到笔记本_新荣耀笔记本与微软系统合作,网友:一碰即传投屏功能还有吗...
  7. Linux Ctrl+c与ctrl+z的区别
  8. “重疾险”和“重大疾病医疗保险”的区别
  9. STL—内存的配置与释放
  10. JSP中的坑(一):一个空格都不能少
  11. JavaScript 验证统一社会信用代码/营业执照注册号
  12. 为CMUSphinx训练声学模型教程手册
  13. java打印两个小人_Swing多线程实现奔跑的小人动画代码实现 | 彬菌
  14. JAVA 事务不生效的常见场景和修改方案
  15. 多项式时间 P问题NP问题
  16. 个人面经整理深信服测开
  17. CTF中MISC常见工具总结
  18. 俄勒冈大学计算机科学专业,俄勒冈大学计算机与信息科学专业怎么样?高薪热门专业等你来...
  19. 数据分析师认证考试形式发布,如何掌握考试重难点?
  20. 《30天自制操作系统》第9天

热门文章

  1. 蓝桥杯第六届决赛真题大全解(java版本)
  2. 蓝桥杯-11-1实现strcmp函数(java)
  3. python连接mysql_Python连接MySQL
  4. Python3算法基础练习:编程100例(11 ~ 15)
  5. Leetcode 124题:求⼆叉树中最⼤路径和
  6. 图片上传时即时生成多个缩略图
  7. 一个简单的jQuery例子,动态添加表格和删除
  8. ZooKeeper 3.4.5 分布式环境搭建详解
  9. Linux下的一些问题收集及解决方法(一)
  10. Dubbo入门(一)