2021-01-14 18:41:19

全文共1709字,预计学习时长5分钟

图源:unsplash

计算机视觉使得计算机能够理解图像和视频的内容,其目标是能够如同人体视觉系统一样,自动完成任务。计算机视觉任务包括图像采集、处理和分析。图像数据以不同的形式呈现,如视频序列、多机位成像,或是来自医学扫描仪的多维数据。本文就将介绍一些适用于机器学习训练的数据集。

Labelme:由麻省理工学院计算机科学和人工智能实验室(CSAIL)共同创建的大型数据集,包含187240张图像、62197张带注释的图像和658992个带标签的对象。

ImageNet:新算法的实际图像数据集,根据WordNet层次结构进行组织,层次结构中的每个节点都由成百上千的图像描述。

LSUN:场景理解,附带许多辅助任务(房间布局估计、显著性预测等)。

MS COCO:COCO是一个大规模的对象检测、分割和说明的数据集,包含200000张以上带标签的图像。可用于对象分割、上下文中的识别等等。

哥伦比亚大学图像库:COIL100数据集包含100个不同的对象,以360°全角度成像。

Visual Genome:是一个数据集兼知识库,旨在将结构化图像概念与语言联系起来。该数据集是包含108077张图像说明的详细视觉知识库。

Lego Bricks:包含大约12700张16种不同乐高积木的图片,按文件夹分类,用Blender进行计算机渲染。

谷歌开放图像:在知识共享(Creative Commons)的支持下,900万张图像的URL“已经用跨越6000多个类别的标签进行了注释”。

开放图像数据集中的带注释的图像。左:Kevin Krejci的“幽灵拱门”。右:J B.的一些银器。两张图像均在CC BY 2.0的许可下使用。

Youtube-8M:由数百万个YouTube视频ID组成的大规模标签数据集,包含超过3800个视觉实体的注释。

Labelled Faces in the Wild:包含13000张带标签的人脸图像,旨在开发人脸识别相关应用。

斯坦福犬类数据集:包含20580张图像和120个犬类品种,每个类别大概150张图像。

Places:以场景为主的数据库,包含205个场景类别和250万个带有类别标签的图像。

CelebFaces:拥有超过200000张名人图像的人脸数据集,每张都有40个属性注释。

CelebFaces数据集中的示例图像

Flowers:在英国常见的花卉图像数据集,由102个不同类别组成。每个花卉类别由40到258张不同姿态和光线变化的图像组成。

Plant Image Analysis:跨越100多万张植物图像的数据集的集合。可以从11种植物中选择。

Home Objects:包含家庭中随机对象的数据集,主要来自厨房、浴室和客厅,分为训练数据集和测试数据集。

CIFAR-10:由60000张32×32彩色图像组成的大型图像数据集,分为10类。数据集分为五个训练批次和一个测试批次,每个批次包含10000张图像。

CompCars:包含163款汽车品牌,共有1716种车型,每种车型都标有五个属性,包括最大速度、排量、车门数量、座椅数量和汽车类型。

室内场景识别数据集:这是一个非常独特的数据集。因为大多数场景识别模型在室外发挥更好,所以该数据集很有用。包含67个室内类别,共15620张图片。

VisualQA:VQA数据集包含265,016张图像的开放性问题。这些问题需要对视觉和语言的理解。对于每张图像,至少有3个问题,每个问题至少有10个答案。

机器学习和计算机视觉的20大图像数据集相关推荐

  1. 苹果公开了其AI研究的第一个大图像数据集

    来啦来啦,苹果近日公开了其AI研究的第一个大图像数据集,带有1.9TB标签的74K高分辨率HDR计算机生成的逼真的室内场景图像:Hypersim Hypersim:用于整体室内场景理解的真实感合成数据 ...

  2. 机器学习和计算机视觉的前20个图像数据集

    作者 | Meiryum Ali 翻译 | 火火酱,责编 | 晋兆雨 出品 | AI科技大本营 头图 | 付费下载于视觉中国 计算机视觉使计算机能够理解图像和视频的内容.计算机视觉的目标是使人类视觉系 ...

  3. 精通机器学习必须掌握的20大算法

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 机器学习是当今计算机科学中最令人兴奋和最受欢迎的领域之一.这不仅关 ...

  4. Dataset:数据集集合(CV方向数据集)-常见的计算机视觉图像数据集大集合包括表面缺陷检测数据集(持续更新)

    Dataset:数据集集合(CV方向数据集)-常见的计算机视觉图像数据集大集合包括表面缺陷检测数据集(建议收藏,持续更新) 目录 CV常用数据集平台集合 Mendeley Data CAISA-Web ...

  5. Dataset之CV:人工智能领域数据集集合(计算机视觉CV方向数据集)之常见的计算机视觉图像数据集大集合(包括表面缺陷检测数据集,持续更新)

    Dataset之CV:人工智能领域数据集集合(计算机视觉CV方向数据集)之常见的计算机视觉图像数据集大集合(包括表面缺陷检测数据集,持续更新) 目录 CV常用数据集平台集合 Mendeley Data ...

  6. 计算机视觉的“惨胜”:反思大型图像数据集

    诞生于第二次世界大战.恐怖纳粹统治时期的1947年纽伦堡法案和随后的1964年赫尔辛基宣言,帮助人们建立起了知情同意原则(Informed Consent),该原则建立在人类尊严和控制关于自己信息传播 ...

  7. AI:一个20年程序猿的学习资料大全—区块链/大数据/数据集/云计算/前沿大会资料——只有你不想要的,没有你找不到的

    AI:一个20年程序猿的学习资料大全-区块链/大数据/数据集/云计算/前沿大会资料--只有你不想要的,没有你找不到的 目录 区块链 ​​​大数据资料 数据集 云计算资料 前沿大会资料报告​ 相关文章 ...

  8. 机器学习和数据科学的最佳公共数据集机器学习、数据科学、情感分析、计算机视觉、自然语言处理 (NLP)、临床数据等的最佳公共数据集。

    数据集查找器 Google 数据集搜索   Google 数据集搜索Google 数据集搜索:与Google Scholar的工作方式类似,数据集搜索可让您在托管数据集的任何地方查找数据集,无论是出版 ...

  9. Dataset:数据集集合(综合性)——机器学习、深度学习算法中常用数据集大集合(建议收藏,持续更新)

    Dataset:数据集集合(综合性)--机器学习.深度学习算法中常用数据集大集合(建议收藏,持续更新) 目录 常规数据集 各大方向分类数据集汇总 具体数据集分类 相关文章 DL:关于深度学习常用数据集 ...

最新文章

  1. 为什么要打jar_生活在西北的兰州人过春节为什么要打太平鼓?
  2. ntp服务器源码c语言,搭建自己的NTP时间服务器
  3. 图解Matlab向量和向量运算
  4. Python操作excel文件根据某一字段将相同的类拆分
  5. USTC English Club Note20171015
  6. 网络协议之:socket协议详解之Socket和Stream Socket
  7. java设置jdk环境变量
  8. 【实践】多场景下的搜索词推荐算法及在腾讯的应用实践.pdf(附下载链接)
  9. Junit框架使用(4)--JUnit常用断言及注解
  10. (转载)Memcached预定义常量
  11. java持久化框架对比_四种流行的持久化框架比较
  12. 【第3讲】 噪声滤波器的原理
  13. 国庆假期,人在囧途,感慨颇多
  14. TLD(Tracking-Learning-Detection)一种目标跟踪算法(相关资料很全)
  15. 纤巧精干:爱普生六轴机器人
  16. PowerPMAC技术培训------3、PowerPMAC编程工具-IDE
  17. 七夕专属程序员的浪漫
  18. Differential dataflow 微分数据流
  19. MySQL中修改ID为自增
  20. 多多情报通:拼多多发布机会商品是谁发货?该怎么发货?

热门文章

  1. ant design vue table 高度自适应_html之table表格
  2. 计算机专业人事制度改革,清华大学计算机系人事制度改革正式启动-清华大学新闻网...
  3. Leetcode刷题 232题:用栈实现队列(基于python3和c++两种语言)
  4. java虚拟机参数-X 与 -XX的区别
  5. 真正理解线程上下文类加载器(多案例分析)
  6. JTEXTFIELD
  7. 16000亿!谷歌发布人类历史首个万亿级模型 Switch Transformer,中国还有机会赶超吗?...
  8. 2020 北京智源大会“云上”开幕, 中外顶尖学者畅想AI的下一个十年
  9. 「鸡娃」是家长无处安放的「应试」焦虑
  10. 死鱼——--摘自《项目百态:深入理解软件项目行为模式 》