问题描述

在做人脸识别的时候,前期的数据处理过程中可能会遇到一个问题,即将人脸从不同尺寸的图像中截取出来,再进行“对齐”操作。这样可以使每一个截取的人脸中的眼睛等位置处于同一位置,会对后面的识别算法起到一定的优化作用。

比如,下面 3 张图片所示,人脸的位置,图像的大小各不一样。我们所需要做的就是,将人脸从各个图片中截取出来,再旋转进行校正,使得眼睛在同一位置上,最后将图片的大小也统一调整为 224 x 224。

校正的效果如下图所示:

实现步骤

前提:已经提取出每张图片里眼睛的坐标,只需要读取数据就行

整个过程遵循以下几个步骤:

找两眼间的直线距离并计算该直线与水平线之间的夹角,即倾斜角度

根据找到的倾斜角度旋转图片

在旋转后的图片中找到眼睛的位置

根据眼睛坐标找到包含面部的框的宽度和高度

调整图片的尺寸

1. 计算直线距离及倾斜角度

计算两眼之间的距离很简单,只要找出两个向量的坐标就可以计算出来。计算两眼之间的距离直线的倾斜角度,就是将两个向量相减,得到一组横纵坐标,然后利用 arctan 的公式求解角度,公式如下所示:

大多数 sin / cos 等函数要求角度为弧度,可以使用这个转换公式:angle = angle * 180 / π。

"""

1.找到眼睛倾斜的角度和两眼距离

"""

p1 = np.array(eye[0])[::-1] # 左眼坐标

p2 = np.array(eye[1])[::-1] # 右眼坐标

dist = np.sqrt(np.sum(p1-p2)**2) # 两只眼睛之间的距离

dp = p1 - p2

angle = np.arctan(dp[0] / dp[1])

2. 根据找到的角度旋转图片

上一步骤中,求出了眼睛的倾斜角度,这一步就可以使用该角度来旋转图片了。这里方便地调用 scipy.ndimage.rotate 来旋转图片。之后再计算出旋转后图片的中点。

"""

2. 旋转图片

"""

from scipy import ndimage

# 旋转图片

rot_img = ndimage.rotate(face, angle=+angle*180/np.pi)

# 旋转后图像的中点

rot_image_center = np.array((np.array(rot_img.shape[:2]) - 1) / 2,

dtype=np.int)

3. 寻找旋转后眼睛的位置

寻找旋转后眼睛的位置,就是寻找旋转后两个点的坐标。旋转的时候,我们是以图片中点为原点来旋转的,因而需要先求解出原图片的原点,也就是图片的中心点。下面是以原点 (x0, y0) 为中心旋转后,求坐标的公式:

"""

3. 在旋转后的图片中找到眼睛的坐标

"""

# 原两眼距离的中点

org_eye_center = np.array((p1 + p2) / 2, dtype=np.int)

# 原图像的中点

org_image_center = np.array((np.array(face.shape[:2]) - 1) / 2, dtype=np.int)

# 以图片中心进行旋转,在旋转后的图片中找到眼睛的中点

R = np.array([[np.cos(angle), np.sin(angle)], [-np.sin(angle), np.cos(angle)]])

rot_eye_center = np.dot(R, org_eye_center[::-1]

-org_image_center[::-1])[::-1] + rot_image_center

rot_eye_center = np.array(rot_eye_center, dtype=int)

4. 根据眼睛坐标找到包含面部的框的宽度和高度

找到旋转后眼睛的坐标,可以利用眼睛的坐标来框出人脸的大致范围。这里就直接看代码,从代码中比较好理解。

"""

4. 根据眼睛坐标找到包含面部的框的宽度和高度

"""

mid_y, mid_x = rot_eye_center

MUL = 2

y_top = int(max(mid_y - MUL * dist, 0))

y_bot = int(min(mid_y + MUL * dist, rot_img.shape[0]))

x_left = int(max(mid_x - MUL * dist, 0))

x_right = int(min(mid_x + MUL * dist, rot_img.shape[1]))

cropped_img = rot_img[y_top:y_bot+1, x_left:x_right+1, :]

5. 裁剪图片

将旋转并框出的人脸进行裁剪,将其设定为统一的尺寸。

"""

5. 裁剪图像的尺寸为 224x224

"""

import skimage.transform as transform

scaled_img = transform.resize(cropped_img, [224, 224], mode='constant')

plt.imshow(scaled_img)

参考文献

python校正人脸_Python 进行人脸校正相关推荐

  1. python 连续矫正_Python实现系统时间自动校正 | 学步园

    最近由于台式机CMOS电池没电了,每次开机后系统时间都会被初始化.出于每次都要重新设置系统时间太麻烦的考虑,今天用Python实现了系统开机自动校正时间的程序.大致的思路是:首先产生一个windows ...

  2. python 摄像头标定_python 3利用Dlib 19.7实现摄像头人脸检测特征点标定

    Python 3 利用 Dlib 19.7 实现摄像头人脸检测特征点标定 0.引言 利用python开发,借助Dlib库捕获摄像头中的人脸,进行实时特征点标定: 图1 工程效果示例(gif) 图2 工 ...

  3. python 提取最小外接矩形_python给人脸带上口罩(简单版)

    导读 因为目前公开的口罩人脸数据比较少,如果想训练一个口罩人脸识别模型,必须依赖大量的人脸数据.为了收集到更多的口罩人脸数据,我们只能利用已有的公开人脸数据上通过程序来模拟人脸带口罩.这篇文章向大家介 ...

  4. python怎么判断真假_Python不超过10行代码就可实现人脸识别,教你辨别真假

    [[爱编程的南风]Python不超过10行代码就可实现人脸识别,教你辨别真假]http://toutiao.com/group/6518157903055045127/?iid=15906422033 ...

  5. python照片过人脸_python openCV实现摄像头获取人脸图片

    本文实例为大家分享了python openCV实现摄像头获取人脸图片的具体代码,供大家参考,具体内容如下 在机器学习中,训练模型需要大量图片,通过openCV中的库可以快捷的调用摄像头,截取图片,可以 ...

  6. python发音机器人_Python深度学习实战:基于TensorFlow和Keras的聊天机器人以及人脸、物体和语音识别...

    序 第1章 TensorFlow基础 1 1.1 张量 2 1.2 计算图与会话 2 1.3 常量.占位符与变量 4 1.4 占位符 6 1.5 创建张量 8 1.5.1 固定张量 9 1.5.2 序 ...

  7. python人脸识别和人脸对比,face_recognition和OpenCV

    前言 先用OpenCV判断图片是否模糊,模糊的话需要重拍: 再用face_recognition检测图片中是否有人脸,有才接着进行下一步: 再用face_recognition计算图片中每张人脸的12 ...

  8. 使用Python和OpenCV进行文本偏斜校正

    使用Python和OpenCV进行文本偏斜校正) 1. 效果图 2. 源码 参考 这篇博客将介绍如何使用Python和OpenCV进行文本偏斜校正.给定图像包含未知角度的旋转文本块,需要通过以下方法纠 ...

  9. 使用 OpenCV 和 Python 模糊和匿名化人脸

    方法 首先,我们使用内置的人脸检测算法,从实时视频或图像中检测人脸.在这里,我们将使用级联分类器方法从实时视频(使用网络摄像头)中检测人脸. 然后,读取来自实时视频的帧.存储最新的帧并转换为灰度,以更 ...

最新文章

  1. “强化学习之父”萨顿:预测学习马上要火,AI将帮我们理解人类意识
  2. rundeck入门-初步操作
  3. 从一个程序员的角度看——微信小应用
  4. python 函数调用 不允许关键字参数_你所不知道的Python|函数参数的演进之路
  5. EasyUI中Dialog对话框的简单使用
  6. linux cat显示若干行
  7. 【英语学习】【WOTD】horticulture 释义/词源/示例
  8. 欠定线性系统与正则化
  9. 如何使用计算机管理员账户,如何使用管理员身份运行程序【图解】
  10. echarts模仿excel复合饼图(饼-饼)
  11. 进阶级 - Git Hub 常用指南
  12. HTML实现简单的贪吃蛇小游戏(附完整源码)
  13. DNS(计算机域名)三种查询
  14. 嵌入式之uboot源码分析-启动第二阶段学习笔记(下篇)
  15. Python wxPython基本教程
  16. lua tcp socket read timed out
  17. 多远线性回归代码-波士顿房价问题
  18. springboot dubbo的java配置
  19. ubantu关机快捷键_ubuntu常用命令及快捷键整理
  20. Python100days_Learning_DAY7

热门文章

  1. 寄存器、缓存、内存之间的关系和区别
  2. 如何通透理解:BFS和DFS优先搜索算法(23年修订版)
  3. 高频交易配对交易学习——Copulas函数理解
  4. Perl 正则表达式 模式匹配
  5. Error: At least one module has an unresolved import due to a missing export function in an implicitl
  6. 如何在linux上的上修改配置ip地址
  7. 玩转DWZ (一)---项目中怎么使用dwz
  8. maven编译问题之 -The POM for XXX is invalid, transitive dependencies (if any) will not be available
  9. 《ucore lab1 练习5》实验报告
  10. 第一个帖子,先灌灌水