一、CV长尾数据集

three long-tailed visual recognition  benchmarks1 : Long-tailed CIFAR-10/-100, ImageNet-LT for image classifification and LVIS for instance segmentation.

CIFAR-10/100

1.1  CIFAR-10 (10类RGB图像,32 × 32 

官方地址:The CIFAR-10 dataset

一个用于识别普适物体的小型数据集。一共包含10 个类别的RGB 彩色图片:飞机( airplane )、汽车( automobile )、鸟类( bird )、猫( cat )、鹿( deer )、狗( dog )、蛙类( frog )、马( horse )、船( ship )和卡车( truck )。

详情参考:Dataset之CIFAR-10:CIFAR-10数据集简介、下载、使用方法之详细攻略

生理信号论文、数据集整理-持续更新_hi_linda的博客-CSDN博客_生理信号数据库

1.2  CIFAR-100 (100类RGB图像,32 × 32 

官方地址:The CIFAR-100 dataset  , CIFAR-10 and CIFAR-100 datasets

它有100个类,每个类包含600个图像。,每类各有500个训练图像和100个测试图像。CIFAR-100中的100个类被分成20个超类。每个图像都带有一个“精细”标签(它所属的类)和一个“粗糙”标签(它所属的超类)

超类 类别
水生哺乳动物 海狸,海豚,水獭,海豹,鲸鱼
水族馆的鱼,比目鱼,射线,鲨鱼,鳟鱼
花卉 兰花,罂粟花,玫瑰,向日葵,郁金香
食品容器 瓶子,碗,罐子,杯子,盘子
水果和蔬菜 苹果,蘑菇,橘子,梨,甜椒
家用电器 时钟,电脑键盘,台灯,电话机,电视机
家用家具 床,椅子,沙发,桌子,衣柜
昆虫 蜜蜂,甲虫,蝴蝶,毛虫,蟑螂
大型食肉动物 熊,豹,狮子,老虎,狼
大型人造户外用品 桥,城堡,房子,路,摩天大楼
大自然的户外场景 云,森林,山,平原,海
大杂食动物和食草动物 骆驼,牛,黑猩猩,大象,袋鼠
中型哺乳动物 狐狸,豪猪,负鼠,浣熊,臭鼬
非昆虫无脊椎动物 螃蟹,龙虾,蜗牛,蜘蛛,蠕虫
宝贝,男孩,女孩,男人,女人
爬行动物 鳄鱼,恐龙,蜥蜴,蛇,乌龟
小型哺乳动物 仓鼠,老鼠,兔子,母老虎,松鼠
树木 枫树,橡树,棕榈,松树,柳树
车辆1 自行车,公共汽车,摩托车,皮卡车,火车
车辆2 割草机,火箭,有轨电车,坦克,拖拉机

CIFAR-10/CIFAR-100数据集解析,重点推荐:

CIFAR10/CIFAR100数据集介绍 - WUST许志伟 - 博客园

1.3 ImageNet-LT

ImageNet-LT[1]是ImageNet数据集的一个长尾子集。它由1k个类组成,超过186k张图像,分别包含116k/20k/50k的训练集/验证集/测试集数据。在训练集中,每个类的图像数量在5-1280个之间,
模拟了在现实世界中普遍存在的长尾分布。
测试和val集被平衡地分成四份:Many-shot每类包含>100图像的类,Medium-shot 包含≥20且≤100图张像的类,Few-shot包含<20图像,以及所有类的总体情况。
【1】Ziwei Liu, Zhongqi Miao, Xiaohang Zhan, Jiayun Wang, Boqing Gong, and Stella X Yu. Large-scale  long-tailed recognition in an open world. In CVPR, 2019.

1.4 LVIS

LVIS [2] 是一个大型词汇表实例分割数据集,在V0.5/V1.0中分别有1230/1203个类别。
二者分别包含57k/100k训练集(V0.5/V1.0),具有显著的长尾分布效应,以及相对平衡的验证集和测试集,验证集包含5k/20k个样本(V0.5/V1.0),测试集包含20k个样本(V0.5/V1.0)。
【2】Agrim Gupta, Piotr Dollar, and Ross Girshick. Lvis: A dataset for large vocabulary instance segmentation. In CVPR, pages 5356–5364, 2019.
【3】Tang K ,  J  Huang,  Zhang H . Long-Tailed Classification by Keeping the Good and Removing the Bad Momentum Causal Effect[J]. NIPS, 2020.

1.5  MINST数据集(10类手写数字灰度图,28 × 28)

官方地址:  MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges

MNIST数据集是机器学习领域中非常经典的一个数据集,由60000个训练样本和10000个测试样本组成,每个样本都是一张28 * 28像素的灰度手写数字图片

二、EEG数据集

以下资源来源于各平台的汇总,感谢以下资源平台的整理!!!!

1.《EEG公开数据集整理》链接:https://zhuanlan.zhihu.com/p/377480885

2.《2020-03-15-脑电数据集中文汇总》链接:https://blog.csdn.net/craig_cc/article/details/105560508?spm=1001.2014.3001.5501

3.《值得收藏!EEG/ MEG/MRI/ fNIRS公开数据库大盘点》链接:

https://blog.csdn.net/weixin_41880581/article/details/106683642

4.睡眠分期数据

MASS dataset:(Montreal Archive of Sleep Studies (MASS)一个大规模开放的睡眠数据集,
数据地址 website Montreal Archive of Sleep Studies (MASS) – CÉAMShttp://www.ceams-carsm.ca/en/MASS包含256 Hz的采样频率和4-20个通道的脑电图(EEG)数据,以及标准的眼电图(EOG)、肌电图(EMG)、心电图(ECG)和呼吸信号。
相关文献
【1】C. O’reilly, N. Gosselin, J. Carrier, and T. Nielsen, “Montreal archive

of sleep studies: an open-access resource for instrument benchmarking
and exploratory research,” Journal of sleep research, vol. 23, no. 6, pp.
628–635, 2014.

三、生理信号论文、数据集整理

生理信号论文、数据集整理-持续更新_hi_linda的博客-CSDN博客_生理信号数据库

CV 长尾数据集-CIFAR-10/100,EEG等生理信号数据集整理相关推荐

  1. 假设训练数据集中有10万个词,四元语法需要存储多少词频和多词相邻频率?《动手学深度学习 李沐》 转

    假设训练数据集中有10万个词,四元语法需要存储多少词频和多词相邻频率? 循环神经网络 Notes 1. 语言模型 语言模型(language model)是自然语言处理的重要技术.自然语言处理中最常见 ...

  2. 重磅!公开基于“内心对话”的EEG脑机接口数据集,助力语音意念控制研究

    脑电图是一种标准的.无创的测量脑电活动的方法.人工智能的最新进展让大脑模式的自动检测得到显著改进,允许越来越快.更可靠和可访问的脑-机接口.很多的范式已被用于实现人机交互.在过去的几年里,对解释和描述 ...

  3. DL之DNN优化技术:自定义MultiLayerNet【5*100+ReLU】对MNIST数据集训练进而比较三种权重初始值(Xavier参数初始化、He参数初始化)性能差异

    DL之DNN优化技术:自定义MultiLayerNet[5*100+ReLU]对MNIST数据集训练进而比较三种权重初始值(Xavier参数初始化.He参数初始化)性能差异 导读 #思路:观察不同的权 ...

  4. js实现随机选取[10,100)中的10个整数,存入一个数组,并排序。 另考虑(10,100]和[10,100]两种情况。...

    1.js实现随机选取[10,100)中的10个整数,存入一个数组,并排序. 1 <!DOCTYPE html> 2 <html lang="en"> 3 & ...

  5. 51nod 1087 1 10 100 1000

    1,10,100,1000...组成序列1101001000...,求这个序列的第N位是0还是1. 收起 输入 第1行:一个数T,表示后面用作输入测试的数的数量.(1 <= T <= 10 ...

  6. DL之LiRDNNCNN:利用LiR、DNN、CNN算法对MNIST手写数字图片(csv)识别数据集实现(10)分类预测

    DL之LiR&DNN&CNN:利用LiR.DNN.CNN算法对MNIST手写数字图片(csv)识别数据集实现(10)分类预测 目录 输出结果 设计思路 核心代码 输出结果 数据集:Da ...

  7. 马化腾:用户体验的10/100/1000法则

    "在研究过程中,腾讯形成了一个"10/100/1000法则":产品经理每个月必须做10个用户调查,关注100个用户博客,收集反馈1000个用户体验." 在研究用 ...

  8. 【51nod - 1087】 1 10 100 1000(找规律推公式,水,map)

    题干: 1,10,100,1000...组成序列1101001000...,求这个序列的第N位是0还是1. Input 第1行:一个数T,表示后面用作输入测试的数的数量.(1 <= T < ...

  9. 51Nod-1087 1 10 100 1000【模拟】

    1087 1 10 100 1000 题目来源:Ural 1209 基准时间限制:1秒 空间限制:131072KB 分值:5难度:1级算法题 1,10,100,1000...组成序列110100100 ...

最新文章

  1. 2022-2028年中国网络出版产业投资分析及前景预测报告
  2. linux 安装输入法
  3. 假期专属论文清单:把国庆长假安排得明明白白!
  4. 关于sql注入之cookie注入
  5. Django框架学习索引
  6. 交互式图表_如何构建罗马数字转换器和交互式罗马数字图表
  7. 关于java内容_关于java一些概念性的内容
  8. Wampserver_开启CURL
  9. 浏览器内核(navigator.appName显示的不是内核信息!!)。
  10. 【Hive】数据导入方法
  11. 【Oracle】查询当前SCN
  12. netty面试题及答案
  13. 机器人建模中移动关节如何建立坐标系_简述空间机器人运动学和动力学建模
  14. 服务器搭建是基于操作系统的,服务器搭建是基于操作系统的
  15. TF内存卡(SDHC)的传输规范
  16. 捕鱼达人(unity实现)
  17. 线上支付对接(支付宝篇)
  18. Sentinel-2(哨兵-2)L1C数据辐亮度(辐射定标)和TOA反射率的获取说明
  19. 法国学术会议申根签证办理(因私)
  20. qtableview选中第一行时表头会变色_亲民的“网红潜水表”精工鱼罐头 Prospex,你会选择吗?...

热门文章

  1. python爬虫破解字体加密案例
  2. Cadence Allegro PCB设计88问解析(五) 之 Allegro中DXF的导入导出
  3. 不能将下载行为传输到IDM的解决方法
  4. Java JSON中的key转换成大写或者小写
  5. 明解C语言 入门 课后习题练习答案 第一章
  6. java_web学期总结
  7. 数字电路和模拟电路-2数字电路基础
  8. stm32 检测相位差 并简单实现两个单片机的通信
  9. VS生成dll,调用dll无法解析
  10. pdb的plug、unplug、drop---oracle 12c 学习(2)