首先恭喜格林深瞳3月18日在科创板成功上市

一、介绍

Glint360K数据集包含36万类别的1800万张图像,不论是类别数还是图像数,相比MS1MV2数据集都有大幅提升。

这是一个号称全球最大最干净的人脸数据集,

下载地址(我自己上传的):链接:https://pan.baidu.com/s/1K3UDER9u352oNIyph-FI1w?pwd=3o3i 
提取码:3o3i 
--来自百度网盘超级会员V5的分享

二、解压和解码

下载好了之后先解压

cat glint360k_* | tar -xzvf -

然后它是.rec格式数据,下面我们将它解码成图片

先简单配置一个小环境:

conda create -n glint
source activate glint
pip install mxnet -i https://pypi.douban.com/simple
pip install opencv-python -i https://pypi.douban.com/simple

编写处理代码:

from __future__ import absolute_import
from __future__ import division
from __future__ import print_function
import argparse
import os
import cv2
import mxnet as mx
def main(args):include_datasets = args.include.split(',')rec_list = []for ds in include_datasets:path_imgrec = os.path.join(ds, 'train.rec')path_imgidx = os.path.join(ds, 'train.idx')imgrec = mx.recordio.MXIndexedRecordIO(path_imgidx, path_imgrec, 'r')  # pylint: disable=redefined-variable-typerec_list.append(imgrec)if not os.path.exists(args.output):os.makedirs(args.output)imgid = 0for ds_id in range(len(rec_list)):imgrec = rec_list[ds_id]s = imgrec.read_idx(0)header, _ = mx.recordio.unpack(s)assert header.flag > 0seq_identity = range(int(header.label[0]), int(header.label[1]))for identity in seq_identity:s = imgrec.read_idx(identity)header, _ = mx.recordio.unpack(s)for _idx in range(int(header.label[0]), int(header.label[1])):s = imgrec.read_idx(_idx)_header, _img = mx.recordio.unpack(s)label = int(_header.label[0])class_path = os.path.join(args.output, "id_%d" % label)if not os.path.exists(class_path):os.makedirs(class_path)_img = mx.image.imdecode(_img).asnumpy()[:, :, ::-1]  # to bgrimage_path = os.path.join(class_path, "%d_%d.jpg" % (label, imgid))cv2.imwrite(image_path, _img)imgid += 1if imgid % 10000 == 0:print(imgid)
if __name__ == '__main__':parser = argparse.ArgumentParser(description='do dataset merge')# generalparser.add_argument('--include', default='', type=str, help='')parser.add_argument('--output', default='', type=str, help='')args = parser.parse_args()main(args)

执行:

python process.py --include=/glint360k/glint360k --output=/glint360k/output

会像这样生成每个id一个文件夹,每个文件夹里面都是同一个人的照片

Glint360K | 使用指南相关推荐

  1. 计算机视觉--CV技术指南文章汇总

    前言  本文汇总了过去本公众号原创的.国外博客翻译的.从其它公众号转载的.从知乎转载的等一些比较重要的文章,并按照论文分享.技术总结三个方面进行了一个简单分类.点击每篇文章标题可阅读详细内容 欢迎关注 ...

  2. 超详细中文预训练模型ERNIE使用指南-源码

    作者 | 高开远,上海交通大学,自然语言处理研究方向 最近在工作上处理的都是中文语料,也尝试了一些最近放出来的预训练模型(ERNIE,BERT-CHINESE,WWM-BERT-CHINESE),比对 ...

  3. 入门指南目录页 -PaddlePaddle 飞桨 入门指南 FAQ合集-深度学习问题

    入门指南目录页 -PaddlePaddle 飞桨 入门指南 FAQ合集 GT_Zhang关注 0.1012019.08.01 18:43:34字数 1,874阅读 795 Hi,欢迎各位来自Paddl ...

  4. ASIC设计-终极指南

    ASIC设计-终极指南 ASIC Design – The Ultimate Guide ASIC设计-终极指南 ASICs代表特定于应用的集成电路,指的是针对特定应用而设计的半导体解决方案,与其他解 ...

  5. Python神经网络集成技术Guide指南

    Python神经网络集成技术Guide指南 本指南将介绍如何加载一个神经网络集成系统并从Python运行推断. 提示 所有框架的神经网络集成系统运行时接口都是相同的,因此本指南适用于所有受支持框架(包 ...

  6. 深度学习框架集成平台C++ Guide指南

    深度学习框架集成平台C++ Guide指南 这个指南详细地介绍了神经网络C++的API,并介绍了许多不同的方法来处理模型. 提示 所有框架运行时接口都是相同的,因此本指南适用于所有受支持框架(包括Te ...

  7. HTML5与CSS3权威指南之CSS3学习记录

    title: HTML5与CSS3权威指南之CSS3学习记录 toc: true date: 2018-10-14 00:06:09 学习资料--<HTML5与CSS3权威指南>(第3版) ...

  8. Maven入门指南⑦:Maven的生命周期和插件

    Maven入门指南⑦:Maven的生命周期和插件 一个完整的项目构建过程通常包括清理.编译.测试.打包.集成测试.验证.部署等步骤,Maven从中抽取了一套完善的.易扩展的生命周期.Maven的生命周 ...

  9. ini文件怎么使用_ftp文件下载工具,ftp文件下载工具是怎么使用的?使用指南

    ftp文件下载工具是什么工具,可能有人会回答说不知道,因为一般只有从事网站管理的工作者会使用的多一点.但不是每个人生来就会的,所以刚开始肯定都会学习怎么使用.这篇文章就来教一下大家ftp文件下载工具是 ...

最新文章

  1. 出去之后,好好做人!华为两年,苦乐参半!
  2. 分享一个MD5加密的工具类
  3. 转 无依赖Office资源的导入导出
  4. 有一个会泰勒级数的八岁表妹是怎样一种体验?
  5. MySQL中函数CONCAT及GROUP_CONCAT 对应oracle中的wm_concat
  6. matlab中图像处理的基本函数(2)
  7. 百度初级认证有用吗_知乎“打败”了百度知道吗?
  8. Unity3d 周分享(11期 2019.2.16)
  9. QCC3040---AppDevice module
  10. 基于ryu实现网络的流量监控--monitor
  11. 华为天才少年主攻存储领域研究
  12. 蓝桥杯练习题之 Fibonacci数列
  13. ThinkpadT420加装上网卡
  14. 鸟哥的Linux私房菜(基础篇)中涉及的所有网址
  15. Linus Torvalds称讨厌被人崇拜
  16. wps软件打不开共享超链接_ppt超链接文件打不开,wps的ppt超链接打不开
  17. mybatis 开启日志记录 打印sql语句
  18. 品牌对比 | 蜜雪冰城 VS 喜茶
  19. librosa 安装
  20. 结算系统业务监控实践

热门文章

  1. 【CSS】CSS文本样式【CSS基础知识详解】
  2. php goto语句,PHP语法:goto 语句
  3. SpringBoot使用HttpClient
  4. 华为弱了?骁龙865Plus加持,Galaxy Tab S7配置曝光
  5. 论文阅读:A Survey of Question Answering over Knowledge Base
  6. 就怕有的同事借到钱,转身就是一辈子 牢记三借三不借!
  7. java getpath()_Java File getAbsolutePath()方法
  8. led护眼灯真的护眼吗?推荐双十一可闭眼盲入的LED灯
  9. Python 下载网络mp4视频资源
  10. 精选用户故事|洞态在聚水潭的误报率几乎为0,如何做到?