SVM算法人脸表情识别

  • 前言
  • 一、算法简介
    • (一)流程
    • (二)原理图
    • (三)HOG特征提取原理
  • 二、代码实现
  • 三、总结
  • 参考资料

前言

准备资料
百度网盘
链接:https://pan.baidu.com/s/1fLkPzNUXPahjGU15nurnNA
提取码:8888

一、算法简介

(一)流程

  • 1.先构建一个HOG特征提取器,到时候图片处理完之后就可以直接提取特征了
  • 2用opencv来读取数据集,但有些照片是检测不出脸的,可以直接删掉
  • 3.如果对一整张照片进行特征提取的话维数就太多了,不仅影响提取和训练速度,进行了图片截取,截取的是嘴巴那一部分的
  • 4.图片处理好了,就是提取图片的特征值了,提取了特征值之后就是筛掉检测不到脸的图片,后面就是训练和保存图像

(二)原理图

(三)HOG特征提取原理

HOG特征提取流程可分为5个部分:检测窗口、归一化图像、计算梯度、统计直方图、梯度直方图归一化、得到HOG特征向量。

  • 1.检测窗口:
    HOG通过窗口(window)和块(block)将图像进行分割。通过以细胞(cell)为单位,对图像某一区域的像素值进行数学计算处理。在此先介绍窗口(window)、块(block)和细胞(cell)的概念及之间的联系。

    • 窗口(window):将图像按一定大小分割成多个相同的窗口,滑动。
    • 块(block):将每个窗口按一定大小分割成多个相同的块,滑动。
    • 细胞(cell):将每个窗口按一定大小分割成多个相同的细胞,属于特征提取的单元,静止不动。
    • 图像(image)->检测窗口(win)->图像块(block)->细胞单元(cell)
  • 2.归一化图像
    归一化分为gamma空间和颜色空间归一化。为减少光照因素影响,将整个图像进行规范化(归一化)。(归一化公式:y=(x-MinValue)/(MaxValue-MinValue))。归一化同时可以避免在图像的纹理强度中,局部的表层曝光贡献度的比重较大的情况。标准化Gamma压缩公式:I(x,y)=I(x,y)^gamma. gamma根据自己效果取值,如1/2.
  • 3.计算梯度
    计算图像横坐标和纵坐标方向的梯度,并根据横坐标和纵坐标的梯度,计算梯度方向。下图为计算公式图:

  • 4.构建梯度直方图
    HOG构建方向梯度直方图在细胞(cell)中完成:
    bins(可理解为划分的个数)决定方向的划分。一般bins取9,将梯度方向划分为9个区间。(注:关于划分区间,有些博主以360°计算。鄙人查opencv书籍,发现确应按180度进行计算,artan所得值得范围即为180°。)例如,假设一个细胞尺寸为6*6,则对这个细胞内的36个像素点,先判断像素点梯度方向所属的区间,后根据像素点的梯度幅值大小和梯度方向的大小进行加权于对应的梯度方向区间。(加权方法可有线性加权、平方根等等各种高大尚的加权方法)
     以下是按照9个区间,进行角度划分的图像。
     
  • 5.块内进行细胞归一化梯度直方图
    局部光照的变化及前景-背景对比度的变化,使梯度强度的变化范围很大,在此需要进行归一化
  • 6.生成HOG特征向量
    最后组合所有的块,生成特征向量:例对于一个64128的窗口而言,每88的像素组成一个cell,每22个cell组成一个块,每个块有94个特征,以8个像素为步长,水平方向将有7个扫描窗口,垂直方向将有15个扫描窗口。所以,一个64128的窗口共367*15=3780个特征,代码中一个hog描述子针对一个检测窗口。

二、代码实现

1.导导入依赖包

# 导入包
import numpy as np
import cv2
import dlib
import random#构建随机测试集和训练集
from sklearn.svm import SVC #导入svm
from sklearn.svm import LinearSVC #导入线性svm
from sklearn.pipeline import Pipeline #导入python里的管道
import os
import joblib#保存模型
from sklearn.preprocessing import StandardScaler,PolynomialFeatures #导入多项式回归和标准化
import tqdm

2.图片路径

folder_path='F:/picture/second/genki4k/'
label='labels.txt'#标签文件
pic_folder='files/'#图片文件路径

3.获得默认的人脸检测器和训练好的人脸68特征点检测器

#获得默认的人脸检测器和训练好的人脸68特征点检测器
def get_detector_and_predicyor():#使用dlib自带的frontal_face_detector作为我们的特征提取器detector = dlib.get_frontal_face_detector()"""功能:人脸检测画框参数:PythonFunction和in Classesin classes表示采样次数,次数越多获取的人脸的次数越多,但更容易框错返回值是矩形的坐标,每个矩形为一个人脸(默认的人脸检测器)"""#返回训练好的人脸68特征点检测器predictor = dlib.shape_predictor('F:/picture/shape_predictor_68_face_landmarks.dat')return detector,predictor
#获取检测器
detector,predictor=get_detector_and_predicyor()

4.截取面部的函数

def cut_face(img,detector,predictor):   #截取面部img_gry=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)rects = detector(img_gry, 0)  if len(rects)!=0:mouth_x=0mouth_y=0landmarks = np.matrix([[p.x, p.y] for p in predictor(img,rects[0]).parts()])for i in range(47,67):#嘴巴范围mouth_x+=landmarks[i][0,0]mouth_y+=landmarks[i][0,1]mouth_x=int(mouth_x/20)mouth_y=int(mouth_y/20)#裁剪图片img_cut=img_gry[mouth_y-20:mouth_y+20,mouth_x-20:mouth_x+20]return img_cutelse:return 0#检测不到人脸返回0

5.提取特征值的函数

#提取特征值
def get_feature(files_train,face,face_feature):for i in tqdm.tqdm(range(len(files_train))):img=cv2.imread(folder_path+pic_folder+files_train[i])cut_img=cut_face(img,detector,predictor)if type(cut_img)!=int:face.append(True)cut_img=cv2.resize(cut_img,(64,64))#padding:边界处理的paddingpadding=(8,8)winstride=(16,16)hogdescrip=hog.compute(cut_img,winstride,padding).reshape((-1,))face_feature.append(hogdescrip)else:face.append(False)#没有检测到脸的face_feature.append(0)

6.筛选函数

def filtrate_face(face,face_feature,face_site): #去掉检测不到脸的图片的特征并返回特征数组和相应标签   face_features=[]#获取标签label_flag=[]with open(folder_path+label,'r') as f:lines=f.read().splitlines()#筛选出能检测到脸的,并收集对应的labelfor i in tqdm.tqdm(range(len(face_site))):if face[i]:#判断是否检测到脸#pop之后要删掉当前元素,后面的元素也要跟着前移,所以每次提取第一位就行了face_features.append(face_feature.pop(0))label_flag.append(int(lines[face_site[i]][0])) else:face_feature.pop(0)datax=np.float64(face_features)datay=np.array(label_flag)return datax,datay

7.多项式SVM

def PolynomialSVC(degree,c=10):#多项式svmreturn Pipeline([# 将源数据 映射到 3阶多项式("poly_features", PolynomialFeatures(degree=degree)),# 标准化("scaler", StandardScaler()),# SVC线性分类器("svm_clf", LinearSVC(C=10, loss="hinge", random_state=42,max_iter=10000))])
#svm高斯核
def RBFKernelSVC(gamma=1.0):return Pipeline([('std_scaler',StandardScaler()),('svc',SVC(kernel='rbf',gamma=gamma))])

8.训练函数\

def train(files_train,train_site):#训练'''files_train:训练文件名的集合train_site :训练文件在文件夹里的位置'''#是否检测到人脸train_face=[]#人脸的特征数组train_feature=[]#提取训练集的特征数组get_feature(files_train,train_face,train_feature)#筛选掉检测不到脸的特征数组train_x,train_y=filtrate_face(train_face,train_feature,train_site)svc=PolynomialSVC(degree=1)svc.fit(train_x,train_y)return svc#返回训练好的模型

9.测试函数

def test(files_test,test_site,svc):#预测,查看结果集'''files_train:训练文件名的集合train_site :训练文件在文件夹里的位置'''#是否检测到人脸test_face=[]#人脸的特征数组test_feature=[]#提取训练集的特征数组get_feature(files_test,test_face,test_feature)#筛选掉检测不到脸的特征数组test_x,test_y=filtrate_face(test_face,test_feature,test_site)pre_y=svc.predict(test_x)ac_rate=0for i in range(len(pre_y)):if(pre_y[i]==test_y[i]):ac_rate+=1ac=ac_rate/len(pre_y)*100print("准确率为"+str(ac)+"%")return ac

10.HOG特征提取器

#设置hog的参数
winsize=(64,64)
blocksize=(32,32)
blockstride=(16,16)
cellsize=(8,8)
nbin=9
#定义hog
hog=cv2.HOGDescriptor(winsize,blocksize,blockstride,cellsize,nbin)
#获取文件夹里有哪些文件
files=os.listdir(folder_path+pic_folder)

11.10-fold cross validation,数据集中随机的9/10做为训练集,剩下的1/10做为测试集,进行十次

ac=float(0)
for j in range(10):site=[i for i in range(4000)]#训练所用的样本所在的位置train_site=random.sample(site,3600)#预测所用样本所在的位置test_site=[]for i in range(len(site)):if site[i] not in train_site:test_site.append(site[i])files_train=[]#训练集,占总数的十分之九for i in range(len(train_site)):files_train.append(files[train_site[i]])#测试集files_test=[]for i in range(len(test_site)):files_test.append(files[test_site[i]])svc=train(files_train,train_site)ac=ac+test(files_test,test_site,svc)save_path='F:/picture/second/train/second'+str(j)+'(hog).pkl'joblib.dump(svc,save_path)
ac=ac/10
print("平均准确率为"+str(ac)+"%")

检测结果

12.检测函数

在这里插入代码片def test1(files_test,test_site,svc):#预测,查看结果集'''files_train:训练文件名的集合train_site :训练文件在文件夹里的位置'''#是否检测到人脸test_face=[]#人脸的特征数组test_feature=[]#提取训练集的特征数组get_feature(files_test,test_face,test_feature)#筛选掉检测不到脸的特征数组test_x,test_y=filtrate_face(test_face,test_feature,test_site)pre_y=svc.predict(test_x)tp=0tn=0for i in range(len(pre_y)):if pre_y[i]==test_y[i] and pre_y[i]==1:tp+=1elif pre_y[i]==test_y[i] and pre_y[i]==0:tn+=1f1=2*tp/(tp+len(pre_y)-tn)print(f1)
svc7=joblib.load('../source/model/smile9(hog).pkl')
site=[i for i in range(4000)]
#训练所用的样本所在的位置
train_site=random.sample(site,3600)
#预测所用样本所在的位置
test_site=[]
for i in range(len(site)):if site[i] not in train_site:test_site.append(site[i])
#测试集
files_test=[]
for i in range(len(test_site)):files_test.append(files[test_site[i]])
test1(files_test,test_site,svc7)


13.笑脸检测函数

def smile_detector(img,svc):cut_img=cut_face(img,detector,predictor)a=[]if type(cut_img)!=int:cut_img=cv2.resize(cut_img,(64,64))#padding:边界处理的paddingpadding=(8,8)winstride=(16,16)hogdescrip=hog.compute(cut_img,winstride,padding).reshape((-1,))a.append(hogdescrip)result=svc.predict(a)a=np.array(a)return result[0]else :return 2

14.图片测试

##图片检测
pic_path='F:/picture/second/facesmile/mytest/xz3.jpg'
img=cv2.imread(pic_path)
result=smile_detector(img,svc7)
if result==1:img=cv2.putText(img,'smile',(21,50),cv2.FONT_HERSHEY_COMPLEX,2.0,(0,255,0),1)
elif result==0:img=cv2.putText(img,'no smile',(21,50),cv2.FONT_HERSHEY_COMPLEX,2.0,(0,255,0),1)
else:img=cv2.putText(img,'no face',(21,50),cv2.FONT_HERSHEY_COMPLEX,2.0,(0,255,0),1)
cv2.imshow('video', img)
cv2.waitKey(0)



15.调用摄像头实时检测并保持,按s键保存刚刚的识别的图片,按esc退出

camera = cv2.VideoCapture(0)#打开摄像头
ok=True
flag=0
# 打开摄像头 参数为输入流,可以为摄像头或视频文件
while ok:ok,img = camera.read()# 转换成灰度图像result=smile_detector(img,svc7)if result==1:img=cv2.putText(img,'smile',(21,50),cv2.FONT_HERSHEY_COMPLEX,2.0,(0,255,0),1)elif result==0:img=cv2.putText(img,'no smile',(21,50),cv2.FONT_HERSHEY_COMPLEX,2.0,(0,255,0),1)else:img=cv2.putText(img,'no face',(21,50),cv2.FONT_HERSHEY_COMPLEX,2.0,(0,255,0),1)cv2.imshow('video', img)k = cv2.waitKey(1)if k == X:    # press 'ESC' to quitbreakelif k==115:pic_save_path='F:/picture/second/result/'+str(flag)+'.jpg'flag+=1cv2.imwrite(pic_save_path,img)
camera.release()
cv2.destroyAllWindows()

三、总结

本次实验通过opencv+python+HOG算法实现微笑检测的,HOG算法优点是·HOG表示边缘的结构特征,可以描述局部的形状信息;位置和方向空间的量化一定程度上可以抑制平移和旋转带来的影响;采用归一化,可以抵消光照带来的变化。

参考资料

微笑识别(HOG+SVM+opencv+python)

SVM算法人脸表情识别相关推荐

  1. 《基于剪切波变换的人脸表情识别》笔记

    [时间]2018.10.16 [题目]<基于剪切波变换的人脸表情识别>笔记 [论文链接]http://www.wanfangdata.com.cn/details/detail.do?_t ...

  2. 【图像识别】基于支持向量机算法svm实现脸部动态特征人脸表情识别附matlab代码

    1 简介 人脸表情识别技术涉及情感计算,图像处理,机器视觉模式识别,生物特征识别等研究领域,是一个极富挑战性的交叉课题.该文介绍一种基于lpq特征,利用支持向量机(SVM)进行分类的人脸表情识别技术. ...

  3. 基于堆栈二值化自动编码器和二值化神经的无约束人脸表情识别算法(An efficient unconstrained FERa based on BAEs and BNN)

    摘要(abstract) 虽然深度学习在许多模式识别任务中都取得了良好的效果,但对于含有大量参数集.标记数据有限的深度网络,过拟合问题仍然是一个严重的问题.在这项工作中,二进制自动编码器(BAEs)和 ...

  4. 高精度人脸表情识别(附GitHub地址)

    编者按:本文原作者吴捷,目前于中山大学就读研究生.研究领域为计算机视觉与自然语言处理.本文原载于知乎,经作者授权发布.欢迎去GitHub给大佬加星. 先放出GitHub地址: https://gith ...

  5. 【技术综述】人脸表情识别研究

    李振东 北京邮电大学硕士在读,计算机视觉方向 言有三 毕业于中国科学院,计算机视觉方向从业者,有三工作室等创始人 作者 | 李振东/言有三 编辑 | 言有三 随着机器学习和深度神经网络两个领域的迅速发 ...

  6. 人脸表情识别概述(一)

    一.人脸表情识别技术目前主要的应用领域包括人机交互.安全.机器人制造.医疗.通信和汽车领域等 二.1971年,心理学家Ekman与Friesen的研究最早提出人类有六种主要情感,每种情感以唯一的表情来 ...

  7. 深度动态序列人脸表情识别——论文笔记

    原文已上传Deep Facial Expression Recognition: A Survey (IEEE) 人脸表情识别分为动态序列识别和静态图片识别,本文只与动态序列有关 这里也有一篇推送解析 ...

  8. 腾讯大佬总结的人脸表情识别技术

    李振东 北京邮电大学硕士在读,计算机视觉方向 言有三 毕业于中国科学院,计算机视觉方向从业者,有三工作室等创始人 作者 | 李振东/言有三 编辑 | 言有三 随着机器学习和深度神经网络两个领域的迅速发 ...

  9. CVPR 2020几篇论文内容点评:目标检测跟踪,人脸表情识别,姿态估计,实例分割等

    CVPR 2020几篇论文内容点评:目标检测跟踪,人脸表情识别,姿态估计,实例分割等 CVPR 2020中选论文放榜后,最新开源项目合集也来了. 本届CPVR共接收6656篇论文,中选1470篇,&q ...

最新文章

  1. [ACM] hdu 1228 A+B (字符串处理)
  2. 利用SQL语句查找某数据库中所有存储过程包含的内容
  3. DayDayUp:三观一致必将取代血缘关系,成为新的人际纽带(博主推荐文章)
  4. 【Python CheckiO 题解】Digits Multiplication
  5. python计算两个数的最大公约数和最小公倍数
  6. Github README.md中添加图片
  7. 51单片机之串口通信、WiFi模块、蓝牙模块、4G模块
  8. rqnoj 2 开心的金明
  9. 一天一看————以太网交换机的基本原理与配置!
  10. maya 阿诺德水晶材质_Maya自带Arnold中的Ai Standard Surface材质如何渲染透明贴图?...
  11. 做好ASO优化方案,步骤。
  12. 基于Scrapy框架对二手车数据进行挖掘
  13. 《少有人走的路-心智成熟的旅程》读书分享
  14. office 2019 word鼠标点击反应慢要等一下
  15. Servlet【黑马】
  16. 高德离线地图瓦片坐标偏移纠偏
  17. Elastic:我应该使用 Logstash 或是 Elasticsearch ingest 节点?
  18. 【ChatGPT军事专家】岸防炮的射速是多少,如何攻破岸防炮
  19. 依概率收敛和依分布收敛(附一道例题)
  20. GET提交中%5B与%5D代表什么意思?

热门文章

  1. 网络购物成瘾,你该如何戒掉?
  2. linux安装MySQL(附安装包)很详细
  3. PTA浙大版《C语言程序设计(第3版)》全部题目解答
  4. python环境变量配置(win10+Python27)
  5. 我开始了我向往的城市生活
  6. Matlab常用函数集合(各类文件读取/保存、数据转换、处理)——持续更新中
  7. 【渝粤题库】陕西师范大学192202 信息技术课程与教学论 作业
  8. Linux使用YUM安装程序
  9. 基于JAVA的物流配送管理系统SSM框架【数据库设计、论文、源码、开题报告】
  10. 互联网科技巨头与资本追逐元宇宙,他们在追逐什么?