faceScrub 数据库是一个公共的名人人脸数据库,其相对与其他的数据库来说,优点是图像比较多,而且清晰度比较好,共有 107,818 张人脸图像, 涵盖530 个名人, 每个人大约200张图片。

居于版权的信息,该数据只提供了图片的链接,没有提供图片本身,跟另外一个数据库PubFig类似,所以我们需要自己写脚本来完成这个图像提取的功能。

这个数据库的文件在这里:http://vintage.winklerbros.net/facescrub.html 下载,文件不大,压缩后的大小只有8M多。

文件格式如下

[plain] view plain copy
  1. name    image_id    face_id url bbox    sha256
  2. Aaron Eckhart   1   1   http://upload.wikimedia.org/wikipedia/commons/5/5d/AaronEckhart10TIFF.jpg   53,177,418,542  dec996994cf1eec33b53c203cff0e8f25638829fa2ad71bb0307d308fa11cdac
  3. Aaron Eckhart   2   2   http://movies.dosthana.com/sites/default/files/image-gallery/Aaron-Eckhart-Image.jpg    80,102,260,282  f84d0c3b1b854a51e6bc031bc353e801834e81df795e85ec1589ca895fb7c1ae
  4. Aaron Eckhart   3   3   http://upload.wikimedia.org/wikipedia/commons/5/52/Aaron_Eckhart_-_002.jpg  203,802,975,1574    8548658ef00f2ac4c384fbfff9d3ae225b4b9e0c2aa45e79a97420381c0f84c9
  5. Aaron Eckhart   4   4   http://25.media.tumblr.com/nJ2vga5sae9o2ks4FltK2lYvo1_400.jpg   62,90,231,259   658d83f35859d2f313ff660c1900427c21eae1c41e3035307428f62b645e64d7
  6. Aaron Eckhart   5   5   http://upload.wikimedia.org/wikipedia/commons/5/5e/Aaron-Eckhart-Traveling.jpg  276,120,492,336 1fa14fed3371280e8785df42cdc5d0335e7923a38f1b0632e3b88a52e850825f
  7. Aaron Eckhart   6   6   http://media.zenfs.com/en_us/Movies/PhotoG/2nd-annual-ampas-governors-awards-2010-aaron-eckhart-53335.jpg   235,158,540,463 121e8bea5caae215b537dc116534bbd2fa7a9a60c1910764d78794ec185aa527
  8. Aaron Eckhart   7   7   http://img2.timeinc.net/people/i/2008/news/080804/aaron_eckhart.jpg 60,57,178,175   bb2e227a9420d6325b67974231d334fc4620e807543a16030d51b35fa8a092f3

所以我们可以很容易的采用提取文本的方法直接去读取和存储图像。

由于最近在学习Python,就用python来完成这个功能吧。

直接贴代码吧。

[python] view plain copy
  1. # -*- coding: utf-8 -*-
  2. """
  3. Created on Tue Apr 07 15:28:53 2015
  4. @author: Chenriwei
  5. """
  6. import os
  7. import re
  8. import time
  9. import urllib
  10. def get_all_iamge(filename):
  11. fid=open(filename)
  12. lines=fid.readlines()
  13. for line in lines:
  14. line_split=line.split('\t')
  15. name=line_split[0]
  16. image_id=line_split[1]
  17. face_id=line_split[2]
  18. box=line_split[4]
  19. image_url=line_split[3]
  20. print image_url+'\n'
  21. print box+'\n'
  22. if False == os.path.exists(name):
  23. os.mkdir(name)
  24. try:
  25. urlopen=urllib.URLopener()
  26. fp = urlopen.open(image_url)
  27. data = fp.read()
  28. fp.close()
  29. file=open(name+'/'+image_id+'.jpg','w+b')
  30. file.write(data)
  31. print "下载成功:"+ image_url
  32. file.close()
  33. except IOError:
  34. print "下载失败:"+ image_url
  35. if __name__ == "__main__":
  36. get_all_iamge('facescrub_actors.txt')

当然这里有个不足之处,是只采用了单线程,所以很慢,下载一个人的图像都要好久。

版权声明:本文为博主原创文章,未经博主允许不得转载。

下载faceScrub人脸数据库(单线程版本)相关推荐

  1. mysql5.045_Microsoft SQL Server数据库各版本下载地址集合

    sql server 2019 enterprise (x64) - dvd (chinese-simplified)企业版 ed2k://|file|cn_sql_server_2019_enter ...

  2. 现有的人脸数据库介绍及下载链接

    在国际上已有的一些人脸数据库: Yale人脸库(美国): 耶鲁大学,15人,每人11张照片,主要包括光照条件的变化,表情的变化等. ORL人脸库(英国): 剑桥大学,40人,每人10张照片,包括表情变 ...

  3. FaceDataset常用的人脸数据库

    from: http://blog.csdn.net/chenriwei2/article/details/50631212 公开人脸数据集 本页面收集到目前为止可以下载到的人脸数据库,可用于训练人脸 ...

  4. 【数据库】FaceDataset常用的人脸数据库

    公开人脸数据集 本页面收集到目前为止可以下载到的人脸数据库,可用于训练人脸深度学习模型. 人脸识别 数据库 描述 用途 获取方法 WebFace 10k+人,约500K张图片 非限制场景 链接 Fac ...

  5. 虹软人脸识别WPF版本,含活体检测

    虹软人脸识别WPF版本,3.0类库,含活体检测 源码地址: https://gitee.com/dacaba/arcface-demo-csharp-wpf3 将对应appid和appkey替换App ...

  6. flyway常用配置_Spring Boot 2 实战:使用 Flyway 管理你数据库的版本变更

    1. 前言 随着项目的不断迭代,数据库表结构.数据都在发生着变化.甚至有的业务在多环境版本并行运行.数据为王的时代,管理好数据库的版本也成为了迫切的需要.如何能做到像 Git 之类的版本控制工具来管理 ...

  7. sonarQube 7.2版本下载配置pmd插件(版本要兼容),并设置只使用pmd规则

    sonarQube 7.2版本下载配置pmd插件(版本要兼容),并设置只使用pmd规则 sonar入门了解 sonarQube是一款优秀的持续集成平台工具,能集成业内常见的CI工具,如Jenkins, ...

  8. (五)为边缘AI人脸识别创建人脸数据库

    目录 介绍 数据库中有什么 创建数据库 填充数据库 下一步 在这里,我们将解释用于人脸识别的简单人脸数据库的结构,开发用于将人脸添加到人脸数据库的实用程序的Python代码,并提供下载人脸以创建数据库 ...

  9. 官网下载Eclipse(包含历史版本及该版本的子版本)

    一.Eclispe下载 1.打开Eclipse官网,默认进入官网首页,官网地址为:https://www.eclipse.org/ 2.点击左上角 Download 进入下载页面进行下载 3.下载页面 ...

  10. mysql数据库有哪些版本_MySQL数据库各个版本的区别

    MySQL数据库各个版本的区别 MySQL数据库 MySQL是一种开放源代码的关系型数据库管理系统(RDBMS),MySQL数据库系统使用最常用的数据库管理语言--结构化查询语言(SQL)进行数据库管 ...

最新文章

  1. 【SharePoint 2010】SharePoint 2010开发方面的课堂中整理有关问题
  2. c语言编写动画屏保源码,发个C代码(简单动画演示)
  3. webpack里JavaScript文件编译的调试
  4. Linux上静态库和动态库的编译和使用
  5. 2.2基本算法之递归和自调用函数_一文学会递归解题
  6. 数据结构摧毁线性表用c语言,[简述]数据结构-线性表(c语言实现)
  7. 计算机曝光模式有哪些,摄影:单反相机中P、A、S、M四种曝光模式的用法详解 -电脑资料...
  8. 机器学习入门——图解集成学习(附代码)
  9. 免费IP切换工具有用吗?
  10. 围棋人机大战属于计算机在什么方面的应用,人民日报评围棋人机大战:胜出的是我们自己...
  11. 小马哥----高仿苹果5se 机型界面图面面观,低配机型 谨防假冒
  12. Vue 项目路由出现 message: “Navigating to current location (XXX) is not allowed“的问题
  13. 使用zepto实现QQ消息左滑删除效果
  14. 华为高清会议摄像机预置位的使用方法
  15. ‘Authentication failed.‘ on server xx.xx.xxx.x:27017. The full response is { “ok“ : 0.0, “errmsg“
  16. 电脑中显示dns服务器可能不可用,Win7网络诊断“DNS服务器可能不可用”怎么解决?-电脑自学网...
  17. 利用wine使用msoffice软件
  18. ae 创建图像等高线 蒙版_「PS软件」工具使用,图层蒙版与橡皮擦的应用分析
  19. 图像Lanczos3滤波——C实现
  20. 软考初级程序员上午单选题(13)

热门文章

  1. 记录MySql错误消息
  2. 由乱序播放说开了去-数组的打乱算法Fisher–Yates Shuffle
  3. DB2创建数据库示例
  4. 岛主 同学给我出的算法题
  5. 一、基础篇--1.3进程和线程-CountDownLatch、CyclicBarrier 和 Semaphore
  6. Combination Sum II - LeetCode
  7. You have new mail in /var/spool/mail/root提示的原因与解决办法
  8. label标签 for属性
  9. smack4中文文档
  10. 写得好 git 提交信息