python识图找图_利用python进行识别相似图片(二)
前言
和网上各种首先你要有一个女朋友的系列一样,想进行人脸判断,首先要有脸,
只要能靠确定人脸的位置,那么进行两张人脸是否相似的操作便迎刃而解了。
所以本篇文章着重讲述如何利用openCV定位人脸。
上一篇文章的地址:
安装openCV
在进行下一步操作时,我们需要安装openCV,本来安装openCV的步骤跟平常安装其他模块一样,而然
由于python的历史原因(用过都懂……),弄得一点都不友好。
先说一下,python2.7的用户,可以直接在openCV的官网上直接下载,然后在openCV的build\python
的目录下,根据自己的情况,选择x86,x64下的cv2.pyd放到你python的安装目录的
\Lib\site-packages\下。
至于python3.4的用户,即有点特别。你可以在StackOverFlow找到这样
和这样的答案,但我们不要这么麻烦。
进入这个网站,下载openCV相关whl文件,例如
opencv_python-3.1.0-cp35-none-win_amd64.whl
然后再对应目录下使用pip install opencv_python-3.1.0-cp35-none-win_amd64.whl命令即可
安装完成后,可以在python的命令行下测试。
import cv2
如果没有报错的话,恭喜你安装成功。
不过无论是哪个版本的用户,在python上使用openCV都需要先安装numpy这个模块。
人脸识别的原理
opencv的人脸识别是基于了haar特征,关于什么叫haar特征,足以开另外一篇文章说明了,碍于篇幅,这里不做介绍。
opencv提供已经训练好的数据写成了xml文件,放在了opencv\sources\data\haarcascades的目录下。
如果只是安装了opencv_python-3.1.0-cp35-none-win_amd64.whl的,可以在我的github上,下载cvdata里面的内容
,地址会在文章底部给出。
除了人脸识别的数据外,还有人眼,上半身,下半身……等人体特征的数据,观察xml文件的命名,不难见名知义。
接下来会介绍如何利用这个已经训练好的数据,如果仍对haar模型感兴趣,可以参考以下地址。
如何使用训练好的数据
先讲关于openCV基本的一些操作。全部具体代码,请查看我的github。
读入一张图片
cv2.imread(path)
如果你用type()把其返回值的类型是numpy.ndarray。
而同样,numpy.asarray(Image)返回的亦是numpy.ndarray对象,为什么强调这两点?
cv2.imread(path)不能读取中文路径,若路径中含有中文字符,其会返回None
在后面的操作中,包括是切割图片(人脸部分),再进行局部哈希,比较相似度,
等等都是用Image对象进行操作,如果再用Image.open()读入图片未免显得麻烦。
所以干脆统一用Image.open()打开图片,再用numpy.asarray(Image)转化即可。
需要注意有一个不同的地方是虽然其返回的也是三维数组,但在第三维,即某个坐标下的RGB值,两个矩阵的顺序是反的,但只要另外编写一个小函数将其反转即可。
载入xml数据
face_cascade = cv2.CascadeClassifier(xml_path)
将图片灰度化
if img.ndim == 3:
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
else:
gray = img
# 如果img维度为3,说明不是灰度图,先转化为灰度图gray,如果不为3,也就是2,原图就是灰度图
img是之前读入的三维数组,虽然灰度图可以用Image对象的convert('L')完成,但由于不确定
opencv的处理方法是否和该方法一样,所以还是用opencv自己的方法进行处理比较好。
获取人脸坐标
faces = face_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=3,
minSize=(10,10),flags=cv2.CASCADE_SCALE_IMAGE)
scale_factor:被检测对象的尺度变化。尺度越大,越容易漏掉检测的对象,但检测速度加快;尺度越小,检测越细致准确,但检测速度变慢。
min_neighbors:数值越大,检测到对象的条件越苛刻;反之检测到对象的条件越宽松;
minSize:检测对象的大小
该方法返回的是一个列表,每个列表元素是长度为四的元组,分别脸部的左上角的x,y值,脸部区域的宽度和高度。
下一步操作
通过上述的方法,我们就已经获取到人脸的位置,下一步你可以通过ImageDraw`对象进行绘图,框出人脸的位置。
同样,你也可以使用Image的crop方法把人脸部分提取出来,然后进行局部哈希,
通过上一篇文章提及的算法,比较两者的相似度。
两种操作分别在我的github中实现了,请参考我的github中face1.py,和face2.py两个python文件。
写一只具有识别能力的图片爬虫
在上一篇文章中,我说了会应用这些算法做成以只具有识别能力的图片爬虫,然现在我也确实是在做
但考虑到作为核心的图片识别和人脸识别的部分我已经写成文章分享出来,其余部分就是想写其他爬虫一样而已,所以我决定看看这两篇文章的反响后再决定是否继续该系列,把图片爬虫的制作过程和大家分享一下。
总结
鉴于个人实力有限,本文未能详细说明人脸识别的原理,
但总结了如何利用已经训练好的数据进行人脸识别,希望能帮到有需要的朋友。
如有不足之处,欢迎提出。
本文涉及内容的详细代码在下面的github地址。
欢迎star,也欢迎给意见
本文参考文章
python识图找图_利用python进行识别相似图片(二)相关推荐
- python数据对比找不同_利用Python读取文件的四种不同方法比对
利用Python读取文件的四种不同方法比对 大家都知道Python 读文件的方式多种多样,但是当需要读取一个大文件的时候,不同的读取方式会有不一样的效果.下面就来看看详细的介绍吧. 场景 逐行读取一个 ...
- 利用python从网页查找数据_利用Python模拟淘宝的搜索过程并对数据进行可视化分析...
数据挖掘入门与实战 公众号: datadw 本文讲述如何利用Python模拟淘宝的搜索过程并对搜索结果进行初步的数据可视化分析. 搜索过程的模拟:淘宝的搜索页面有两种形式, 一种形式是, 2019/2 ...
- python制作心形照片墙_利用python生成照片墙的示例代码
PIL(Python Image Library)是python的第三方图像处理库,但是由于其强大的功能与众多的使用人数,几乎已经被认为是python官方图像处理库了.其官方主页为:PIL. PIL历 ...
- python用渐变色画圆_利用python控制Autocad:pyautocad方式
发现pyautocad模块:可以用python控制autocad的包.今天把文档中的重点内容摘录出来,以后绘图.计算大工程量.或者识别施工图的时候时候也许可以用到. 一.连接cad pyautocad ...
- python画一颗心_利用python画一颗心的方法示例
前言 Python一般使用Matplotlib制作统计图形,用它自己的说法是'让简单的事情简单,让复杂的事情变得可能'.用它可以制作折线图,直方图,条形图,散点图,饼图,谱图等等你能想到的和想不到的统 ...
- python实现英文新闻摘要自动提取_利用Python实现摘要自动提取,完美瘦身只需一行代码...
原标题:利用Python实现摘要自动提取,完美瘦身只需一行代码 今天给大家推荐一个也可以用于关键字提取的算法TextRank,但主要实现的功能是快速从长篇新闻中抽取精准摘要. 前言介绍 TextRan ...
- python画圣诞老人简笔画_利用Python绘制有趣的万圣节南瓜怪效果
关于万圣节 万圣节又叫诸圣节,在每年的11月1日,是西方的传统节日;而万圣节前夜的10月31日是这个节日最热闹的时刻.在中文里,常常把万圣节前夜(Halloween)讹译为万圣节(All Saints ...
- python制作的网站例子_利用Python绘制Jazz网络图的例子
最近在进行社交网络的学习,想利用Python来进行分析,但是网上关于这方面的资料好像很少,所以自己进行了一点研究,算是有一点点进步,现在将自己的成果发出来,希望这方面感兴趣的同学也可以快速入门.话不多 ...
- python处理水站的数据_利用Python进行数据分析(一):数据清洗与准备
b站的小伙伴们大家吼~~ 在b站摸了快四年鱼的菜鸡也想开始做知识分享了,虽然说是分享其实根本目的也是为了督促自己好好学习把QAQ. 从今天开始,我将会在专栏分享我在学习<利用Python进行数据 ...
- python实现冒泡排序完整算法_利用python实现冒泡排序算法实例代码
利用python实现冒泡排序算法实例代码 冒泡排序 冒泡排序(英语:Bubble Sort)是一种简单的排序算法.它重复地遍历要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们交换过来.遍历数 ...
最新文章
- 计算机与生命科学交叉应用,第二届 “数学、计算机与生命科学交叉研究”青年学者论坛...
- (转)uml 静态视图关系和关联
- alpine linux安装java,alpinelinux安装openjre
- 真实用!推荐一款与Swagger媲美的数据库文档生成工具...
- paip.asp vbs通过CLI命令行调用PHP代码
- java中改变文本字体和大小_修改eclipse 代码字体大小以及文档字体大小
- 概率论与数理统计(第四版) 第一章:概率论的基本概念(总结)
- 计算机维护测试工作,(人才测评)桌面运维工程师的招聘入职测评方案
- 【gloomyfish】【原创】数据分析之 – 散点图
- 网络投票的另一面:“刷票”与“防刷” 大PK
- EndNote论文参考文献中文文章与英文文章前后顺序修改排列方法
- MCU裸系统下快速平方根实现
- 使用网址--java JPI代码示例
- JS实现延时3秒刷新
- linux修改禅道端口,CentOS7上安装了gitlab和禅道,改了禅道端口访问不了
- 其他网页可以使用,但百度首页打不开,百度搜索无法使用,怎么办
- commander、ora、chalk、inquirer使用
- 手把手带你 arduino 开发:基于ESP32S 的第一个应用-红外测温枪(带引脚图)
- IDEA 各种疑难杂症
- 安装xshell和Xftp时出现致命错误:-1603的解决方法
热门文章
- 不搞代码来搞我,我又动了谁的奶酪?
- 第 2 节:前端面试指南 — HTML篇
- 互联网又一个变态条款 “奋斗者协议”
- 如何把项目部署到云服务器上,如何把项目部署到云主机
- linux日志绕接,Logback配置
- python保存rtmp流_ffmpeg 推送、保存rtmp 流命令
- 国家生物信息中心在核酸研究发表单细胞DNA甲基化数据库—scMethBank
- 不怕贼偷,就怕贼惦记!
- 转录组测序多少生物重复合适?2个?3个?48个?
- 参考文献自动搜集管理完美攻略(图文版): Latex+Lyx+Zotero