本文整理了近些年常用的小样本数据集,提供了数据集介绍,参考文献以及下载地址。我手头有资源的都已经上传至百度云盘,其他数据集也提供了官方的下载地址(有些可能需要翻墙)。最后还对各个数据集的情况做了一个简单的汇总。

1.Omniglot

  Omniglot数据集是由来自50种不同语言的1,623个手写字符构成的,每个字符都有20个不同的笔迹,这就构成了一个样本类别极多(1623种),但每种类别的样本数量极少(20个)的小样本手写字符数据集。使用中通常选择1200种字符作为训练集,剩余的423种字符作为验证集,并通过旋转90°,180°和270°进行数据集扩张,每张图片通过裁剪将尺寸统一为28*28。
  参考文献:Lake B, Salakhutdinov R, Gross J, et al. One shot learning of simple visual concepts[C]//Proceedings of the annual meeting of the cognitive science society. 2011, 33(33).
  下载地址:https://pan.baidu.com/s/19Y5aGfa-lNEZTDUeL1jP4g
  提取码:4y3z

2. miniImageNet

  miniImageNet数据集是从ImageNet数据集中选择了60,000张图像构成的,共100个类别,每个类别有600张图像,每幅图像的尺寸为84*84。使用中通常选择其中80个类别的图像作为训练集,剩余的20个类别的图像作为验证集。也有的文章将其分为基础集(Base Class,64种),验证集(Validation Class,16种)和新类别集(Novel Class,20种)。
  参考文献:Vinyals O, Blundell C, Lillicrap T, et al. Matching networks for one shot learning[C]//Advances in neural information processing systems. 2016: 3630-3638.
  下载地址:https://pan.baidu.com/s/1nqBSA1w5mQuhlrQeCY4HgA
  提取码:ajrz

3. tieredImageNet

  tieredImageNet数据集也是从ImageNet数据集中选取的,包含34个大类(Categories),每个大类有包含10-30个小类(Classes),每个类别有数量不等的多个图像样本,共计608个类别,779,165张图像(平均每个类别包含1281张图片)。34个大类可划分为训练集(20大类),验证集(6大类)和测试集(8大类),数据集划分情况如下图。

  参考文献:Ren M, Triantafillou E, Ravi S, et al. Meta-learning for semi-supervised few-shot classification[J]. arXiv preprint arXiv:1803.00676, 2018.
  下载地址:
https://drive.google.com/uc?export=download&confirm=_SLS&id=1g1aIDy2Ar_MViF2gDXFYDBTR-HYecV07

4. CUB-200

  CUB-200数据集全称为Caltech-UCSD Birds-200-2011数据集,是由加利福尼亚理工学院提供的鸟类数据库,共包含200种鸟类的11,788张图像。使用中通常划分为训练集(100种),验证集(50种)和测试集(50种),图像尺寸统一裁剪为84*84。
  参考文献:Catherine Wah, Steve Branson, Peter Welinder, Pietro Perona, and Serge Belongie. The caltech-ucsd birds- 200-2011 dataset. 2011.
  下载地址:https://pan.baidu.com/s/1DEmLxePvDuJX1goSzM9r6Q
  提取码:f1l5

5. CIFAR-FS

  CIFAR-FS数据集全称为CIFAR100 Few-Shots数据集,是来自于CIFAR 100数据集,共包含100类别,每个类别600张图像,合计60,000张图像。使用中通常划分为训练集(64种),验证集(16种)和测试集(20种),图像尺寸统一为32*32。
  参考文献:Bertinetto L, Henriques J F, Torr P H S, et al. Meta-learning with differentiable closed-form solvers[J]. arXiv preprint arXiv:1805.08136, 2018.
  下载地址:https://pan.baidu.com/s/1HqRUw3dmsMBInt_Fh3J_Uw
  提取码:ub38

6. ImageNet-1K Challenge

  ImageNet-1K Challenge数据集同样来自ImageNet数据集,是共包含1000类别。使用中通常划分为基础数据集(389个类别)和新样本数据集(611种)。
  参考文献:Hariharan B, Girshick R. Low-shot visual recognition by shrinking and hallucinating features[C]//Proceedings of the IEEE International Conference on Computer Vision. 2017: 3018-3027.
  下载地址:http://www.image-net.org/

7. FC100

  FC100数据集全称是Few-shot CIFAR100数据集,与上文的CIFAR-FS数据集类似,同样来自CIFAR100数据集,共包含100类别,每个类别600张图像,合计60,000张图像。但不同之处在于  FC100不是按照类别(Class)进行划分的,而是按照超类(Superclass)进行划分的。共包含20个超类(60个类别),其中训练集12个超类,验证集4个超类(20个类别),测试集4个超类(20个类别)。
  参考文献:Oreshkin B, López P R, Lacoste A. Tadam: Task dependent adaptive metric for improved few-shot learning[C]//Advances in Neural Information Processing Systems. 2018: 721-731.
  下载地址:https://pan.baidu.com/s/1Wnlp1-obKsMLcHITYQ1CLg
  提取码:kcd6

                   小样本数据集汇总表

小样本数据集 来源 类别数 图片数 图片尺寸
Omniglot - 1623 32,460 28*28
miniImageNet ImageNet 100 60,000 84*84
tieredImageNet ImageNet 608 779,165 84*84
ImageNet 1K ImageNet 1000 - -
CIFAR-FS CIFAR 100 100 60,000 32*32
FC100 CIFAR 100 100 60,000 32*32
CUB-200 - 200 11,788 84*84

如果大家对于深度学习与计算机视觉领域感兴趣,希望获得更多的知识分享与最新的论文解读,欢迎关注我的个人公众号“深视”。

常用小样本数据集介绍与下载汇总相关推荐

  1. 【知识星球】数据集板块重磅发布,海量数据集介绍与下载

    有三AI知识星球的"数据集板块"正式上线,提供数据集介绍,论文下载,数据集下载3大功能,那些因为网速问题,因为需要签license的蛋疼问题,从此不再成为问题! 有三AI知识星球- ...

  2. 深度学习常用数据集介绍与下载(附网盘链接)

    摘要 这篇博文总结了博主收集的深度学习常用的数据集,包含常用的分类.目标检测及人脸识别任务,对每个数据集给出了简要介绍.官网下载网站以及公众号获取的关键字.因为有的数据集较大,官网的下载速度可能比较慢 ...

  3. Imdb影评的数据集介绍与下载

    1. Imdb影评的数据集介绍 这是用于二分类情感分类的数据集,其包含的数据比以前的基准数据集要多得多. 我们提供了25,000电影评论用于训练,而25,000条电影评论用于测试. 也有其他未标记的数 ...

  4. 深度学习常用的训练数据集介绍以及下载

    前言:数据是深度学习的血液,本文介绍一下当前非常常见的一些数据集. 1 ImageNet ImageNet是一个计算机视觉系统识别项目,是目前世界上图像识别最大的数据库.是美国斯坦福的计算机科学家李飞 ...

  5. python第三方库下载-python常用第三方库介绍及下载

    GUI 1.wxpython(2.9.2.4--python2.6/2.7) Python下的GUI编程框架,与MFC的架构相似 2.PyQt(4.86--python2.5~3.2) 用于Pytho ...

  6. 全球25米分辨率PALSAR镶嵌式和森林/非森林地图(FNF)。数据集介绍及下载

    一.概述 为了提高对全球环境变化影响的理解和应对,对全球土地覆盖的及时和一致的监测, 利用卫星遥感进行全球监测是检测土地表面变化的最有效方法之一,如森林砍伐和森林退化,因为卫星可以定期提供覆盖广泛地区 ...

  7. FVC指纹验证竞赛2004数据集介绍及下载地址

    下载链接1 http://bias.csr.unibo.it/fvc2004/databases.asp 下载链接2https://download.csdn.net/download/sereasu ...

  8. 【知识星球】几个人像分割数据集简介和下载

    欢迎大家来到<知识星球>专栏,今天给大家介绍一下人像分割相关的几个数据集,并提供下载. 作者&编辑 | 言有三 有三AI知识星球的"数据集"板块中已经提供了非常 ...

  9. 运动想象 BCI IV-2a 数据集介绍

    一.数据集介绍及下载链接 http://www.bbci.de/competition/iv/#download 二.数据格式 1.数据一共有9名被试,每个被试在不同天做了两个session,每个se ...

  10. Penn Treebank数据集介绍+句法分析parsed的基本语法+句法分析基础知识+NLP常用公开数据集汇总及下载

    Penn Treebank数据集介绍+句法分析parsed的基本语法+句法分析基础知识+NLP常用公开数据集汇总及下载 Penn Treebank数据集介绍 NLP底层技术之句法分析 NLP常用公开数 ...

最新文章

  1. python【数据结构与算法】KMP算法模板(我吐了!)
  2. md是什么类型的文件?怎么打开md文件,Markdown的编写,Markdown转化为html
  3. java2d游戏代码_Java 2D游戏图形
  4. Java千百问_03基本的语法(005)_二进制是如何做位运算的
  5. MYSQL 从头开始-1
  6. org manual翻译--2.1 大纲
  7. android 7.1 apk的systemuid [2]
  8. 特征做得好,模型没烦恼
  9. 定位导航方案在特殊环境下的适用说明
  10. php 获取域名_在PHP中截取当前页面URL地址及URL信息的方法
  11. Facebook 发布全新 JavaScript 引擎:Hermes! | CSDN博文精选
  12. telnet直接登录POP3
  13. 金橙子激光打标机的二次开发(C#)
  14. 刷脸支付是在扫码支付的基础上发展而来
  15. CSAPP Lab5--Writing a Dynamic Storage Allocator
  16. mysql 基础 红黑联盟_[转载]mysql日期加减 – mysql数据库栏目 – 红黑联盟
  17. SSID、BSSID、ESSID的区别
  18. mac虚拟摄像头开发
  19. 整理总结:英语口语发音技巧
  20. 增加检测类别?这是一份目标检测的基础指南

热门文章

  1. 2023 年十大战略技术趋势中哪一项最需要 HTAP ?
  2. 怎么修改MAC电脑名字,三步教你修改MAC电脑的名字
  3. Akka-CQRS(9)- gRPC,实现前端设备与平台系统的高效集成
  4. 基于容器的虚拟化资源调度系统的架构设计
  5. 30岁开始学编程晚吗?
  6. 指针万用表使用欧姆档测量电容器时偏转
  7. 二维码在线制作免费快速
  8. mpAndroidchart 坐标和图表距离_合二为一——在Excel中制作组合图表!
  9. (VGG)VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION--Karen Simonyan
  10. 磁盘转换|如何将mbr转换成gpt?