文中部分内容转自两位大神,本人根据前人工作自行进行总结,将celeba数据集在windows上的生成做了进一步解释。
https://blog.csdn.net/weixin_39881922/article/details/81877005
https://blog.csdn.net/yunyi4367/article/details/80784205

CeleA是香港中文大学的开放数据,包含202599张人脸数据。
下载地址:
官网链接
百度网盘
下载好数据集之后可看到如下目录,其中Img里面的数据便是可用于深度学习训练的人脸数据。

打开Img可看到如下目录,其中 img_celeba.7z文件夹下面有14个压缩包,解压后可得到作者从网上爬虫得到的数据原图,这个数据大小不一,未经裁剪。 img_align_celeba_png.7z文件夹中有16个压缩包,是将原图裁剪后得到的
178*218大小的png数据,比较大。 img_align_celeba.zip 压缩包内是202599张剪切为178*218的jpg格式数据,可直接解压使用。

解压后可得到这样的一些jpg数据。

在深度学习中,我们往往需要方形的数据、高清数据集,或由于cpu/gpu计算能力不足而需要将人脸resize。这就需要我们生成高清人脸数据集CelebA-HQ。
1.解压得到原图
已经下载好img_celeba.7z 需要将其中的14个压缩包解压,得到202599张从原图。
原来的压缩包是这样的,无法直接解压。

windows:copy /B img_celeba.7z.0** img_celeba.7z
linux: cat img_celeba.7z.0** > img_celeba.7z
就可以合并压缩包,得到这个压缩包就可以直接解压得到202599张图片了。
2.下载deltas文件
https://drive.google.com/drive/folders/0B4qLcYyJmiz0TXY1NG02bzZVRGs
文件夹内有30个zip文件,不需要解压缩。注意里面的 image_list.txt 不能丢掉。

3.下载github上这位仁兄的h5tool.py,他的才能直接得到jpg文件,另外一个大兄弟的得到的是hdf5文件
https://github.com/willylulu/celeba-hq-modified

4.创建图片保存目录:
当前文件夹下创建目录celeba-hq,在此目录下创建如下目录。

4.的到最终目录如下:

python2.7环境下执行命令:
python h5tool.py create_celeba_hq 123456.h5 ./ ./delta/
便可以生成30000张64,128,256,512,1024的高清celeba人脸图片。

(五)CelebA CelebA-HQ相关推荐

  1. MTCNN中celebA数据集的处理(一个置信度,两个坐标点)

    我处理这个数据集是用来训练MTCNN网络的,celebA数据集由202599张人脸组成,这里主要是将样本扩容,即在原有的图片上抠图. 因为上面是MTCNN的框架,由P,R,O三个网络组成,P网络输入的 ...

  2. 对抗生成网络学习(十五)——starGAN实现人脸属性修改(tensorflow实现)

    一.背景 最近事情比较多,一个多月没写CSDN了,最近打算做一做satrGAN. starGAN是Yunjey Choi等人于17年11月提出的一个模型[1].该模型可以实现人脸的属性修改,原理上来说 ...

  3. 对抗生成网络学习(十一)——SAGAN生成更为精细的人脸图像(tensorflow实现)

    一.背景 SAGAN全称为Self-Attention Generative Adversarial Networks,是由Han Zhang等人[1]于18年5月提出的一种模型.文章中作者解释到,传 ...

  4. 【数据集NO.3】人脸识别数据集汇总

    文章目录 前言 一.IMDB-WIKI人脸数据集 二.WiderFace人脸检测数据集 三.GENKI 人脸图像数据集 四.哥伦比亚大学公众人物脸部数据库 五.CelebA人脸数据集 六.美国国防部人 ...

  5. 第十一课.DCGAN与CycleGAN

    目录 DCGAN DCGAN简介 DCGAN生成celebA celebA介绍 准备工作 模型定义 训练生成网络与判别网络 CycleGAN DCGAN DCGAN简介 DCGAN是基于DeConvl ...

  6. 「每周CV论文推荐」 初学深度学习人脸属性分析必读的文章

    人脸属性分析在社交娱乐,人机交互等领域有重要的作用,本次我们介绍初学人脸属性分析需要读的文章,包括年龄,表情等. 作者&编辑 | 言有三 1 IMDB-WIKI 人脸年龄的估计包括真实年龄和表 ...

  7. 【每周CV论文推荐】 初学深度学习人脸属性分析必读的文章

    欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 人脸属性分析在社交娱乐,人机交互等领域有重要 ...

  8. python人脸识别训练模型生产_深度学习-人脸识别DFACE模型pytorch训练(二)

    首先介绍一下MTCNN的网络结构,MTCNN有三种网络,训练网络的时候需要通过三部分分别进行,每一层网络都依赖前一层网络产生训练数据供当前训练网络,这样也推动了两个网络之间的最小损耗. Pnet Rn ...

  9. pytorch读取常用数据集dataset实现例子

    MNIST示例 定义 class MNIST(VisionDataset):"""`MNIST <http://yann.lecun.com/exdb/mnist/ ...

最新文章

  1. 用Python深入理解跳跃表原理及实现
  2. 四面体的表面积_为了解释南北两极海陆的分布,科学家提出了一个“四面体”的观点...
  3. Centos7 yum 安装 oracle-rdbms-server-11gR2-pre
  4. outlook可以显示多少行文本_Linux学习从处理文本开始
  5. linux svn启动失败,linux svn authorization failed错误
  6. rsync 安装 配置 实例
  7. 你可能不知道的shell、bash二三事(Centos 7)
  8. 从php的生命周期来优化页面响应时间
  9. 当不知轴承型号时如何寻找轴承故障频率_知课堂 | 快速计算轴承特征频率
  10. vue 动态添加组件
  11. A类业余电台操作证书考试内容提要
  12. 自己组装的台式电脑怎么安装系统教学
  13. 怎样解决迅雷下载时的版权限制-两招解决迅雷下载版权限制
  14. 【C基础练习题】Week9:凯撒密码 | 按空格切分字符串 | 单词折半拆分
  15. 随机过程、马尔可夫链 详解
  16. 【Pytorch】内存够用但还是 RuntimeError: CUDA out of memory 问题解决
  17. Linux里用脚本关闭进程的方式
  18. 人工智能-线性回归与逻辑回归
  19. 网盘搜索_就用网盘传奇-最有效的百度网盘搜索引擎
  20. ## 格拉斯哥学院学生月生活费情况

热门文章

  1. python中无穷大与无穷小表示
  2. ExcelJS 导出excel xlxs 格式【前端导出】
  3. EventBus使用详细讲解,结合示例
  4. 一位电子工程师从学校到工作岗位的项目经历,或许你可以借鉴
  5. “hackers and painters”读书笔记
  6. excel 魔法卡片_在Excel中制作情人节卡片
  7. 企企通SRM:如何做好供应商管理?这些步骤不可少
  8. python 批量读取csv_python批量读取csv文件
  9. 2021年R2移动式压力容器充装复审考试及R2移动式压力容器充装证考试
  10. java计算机毕业设计贺卡商城设计与实现MyBatis+系统+LW文档+源码+调试部署