作者 | Meiryum Ali

翻译 | 火火酱,责编 | 晋兆雨

出品 | AI科技大本营

头图 | 付费下载于视觉中国

计算机视觉使计算机能够理解图像和视频的内容。计算机视觉的目标是使人类视觉系统可以实现任务自动化。

计算机视觉任务包括图像采集、图像处理和图像分析。图像数据可以采用不同的形式,例如视频序列,从多个角度的不同的摄像机查看图像或来自医疗扫描仪的多维数据。

用于计算机视觉训练的图像数据集

Labelme:麻省理工学院计算机科学与人工智能实验室(CSAIL)创建的大型数据集,包含187,240张图像、62,197条带注释的图像和658,992张带标签的对象。

乐高积木:通过文件夹和使用Blender渲染的计算机对大约16700种乐高积木进行分类的大约12,700张图像。

ImageNet:用于新算法的实际图像数据集。根据WordNet层次结构进行组织,其中层次结构的每个节点都以成千上万的图像进行描绘。

LSUN:具有许多辅助任务的场景理解(房间布局估计、显着性预测等)

MS COCO:COCO是包含200,000多个标记图像的大规模对象检测、分割和字幕数据集。它可以用于对象分割,上下文识别以及许多其他用例。

哥伦比亚大学图像库:COIL100是一个数据集,其中包含360个旋转角度中每个角度成像的100个不同对象。

视觉基因组:视觉基因组是一个数据集和知识库,旨在将结构化图像概念与语言联系起来。该数据库具有详细的视觉知识库,并带有108,077张图像的字幕。

Google的开放图像:“Creative Commons”下900万个URL的图像集合,这些URL已用6000多个类别的标签进行了注释。

来自“打开图像”数据集的带注释的图像。

左:Kevin Krejci的《鬼拱门》。右:J B制造的银制厨房用具。两个图像均在CC BY 2.0许可下使用。

Youtube-8M:带有标签的大规模数据集,由数百万个YouTube视频ID组成,带有超过3,800多个视觉实体的注释。

带标签的野外面孔:13,000个带标签的人脸图像,用于开发涉及面部识别的应用程序。

斯坦福犬类数据集:包含20,580张图像和120种不同的犬种类别,每个类别约有150张图像。

地点:以场景为中心的数据库,其中包含205个场景类别和250万个带有类别标签的图像。

CelebFaces:具有超过200,000张名人图像的人脸数据集,每个图像带有40个属性注释。

来自CelebFaces数据集的样本图像。

花卉:在英国常见的花朵图像数据集,包含102个不同类别。每个花类由40至258张图像组成,这些图像具有不同的姿势和光线变化。

植物图像分析:涵盖超过一百万张植物图像的数据集。可以从11种植物中选择。

家庭对象:一个数据集,其中包含来自家庭的随机对象,大部分来自厨房、浴室和客厅,这些对象分为训练和测试数据集。

CIFAR-10:包含60,000张32×32彩色图像的大型图像数据集,分为10类。数据集分为五个训练批次和一个测试批次,每个批次包含10,000张图像。

CompCars:包含163种车型,包含1,716种车型,每种车型都标有五个属性,包括最大速度、排量、门数、座位数和汽车类型。

室内场景识别:非常具体的数据集,非常有用,因为大多数场景识别模型在“外部”效果更好。包含67个室内类别,共15620张图像。

VisualQA:VQA是一个数据集,包含有关265,016张图像的开放式问题。这些问题需要对视觉和语言的理解。对于每个图像,至少有3个问题,每个问题10个答案。

*本文仅代表作者个人观点,不代表AI科技大本营任何立场。

原文链接:

https://hackernoon.com/top-20-image-datasets-for-machine-learning-and-computer-vision-rq3w3zxo

本文由AI科技大本营翻译,转载请注明出处

更多精彩推荐
  • 为什么苹果M1芯片这么快?

  • 仅剩一周!!CSDN年终大放血!人人有份的大奖你确定不来?

  • GitHub 超 20000 Star,最火开源视频库 FFmpeg 这 20 年!

  • 都 2021 年了,Serverless 能取代微服务吗?

  • 2020年中国AI算力报告发布:超大算法模型挑战之下,公共AI算力基建是关键

机器学习和计算机视觉的前20个图像数据集相关推荐

  1. 机器学习和计算机视觉的20大图像数据集

    2021-01-14 18:41:19 全文共1709字,预计学习时长5分钟 图源:unsplash 计算机视觉使得计算机能够理解图像和视频的内容,其目标是能够如同人体视觉系统一样,自动完成任务.计算 ...

  2. 从0基础到全国亚军,自学机器学习如何挺进Kaggle前20%

    前半部分是各种碎碎念,介绍自己0基础入门机器学习的经历,不喜欢可以跳过 后半部分介绍自己的比赛方案 双非文科出身,0基础完全靠自学入门[机器学习],在一场练习赛中Sole,成绩从第1661名达到了全球 ...

  3. 计算机视觉方向地理空间遥感图像数据集汇总

    文章目录 1.DSTL卫星图像数据集/Kaggle竞赛 2.Swimming Pool and Car Detection/Kaggle竞赛 3.SpaceNet Challenge 3数据集 4.R ...

  4. 【机器学习】【计算机视觉】非常全面的图像数据集《Actions》

    目录(?)[+] 1.搜狗实验室数据集: http://www.sogou.com/labs/dl/p.html 互联网图片库来自sogou图片搜索所索引的部分数据.其中收集了包括人物.动物.建筑.机 ...

  5. 腾讯开源最大规模多标签图像数据集,刷新行业数据集基准

    ↑ 点击上方[计算机视觉联盟]关注我们 腾讯 AI Lab 公布的图像数据集 ML-Images,包含了 1800 万图像和 1.1 万多种常见物体类别,在业内已公开的多标签图像数据集中规模最大,足以 ...

  6. 干货丨机器学习必备:前20名Python人工智能和机器学习开源项目

    如今机器学习和人工智能已经变得家喻户晓,有很多爱好者进入了该领域.但是,什么才是能够进入该领域的正确路径呢?如何保持自己跟上该领域的发展步伐呢? 为了解决以上两个问题,可以通过利用高级专业人员每天使用 ...

  7. 机器学习必备:前20名Python人工智能和机器学习开源项目

    摘要: 机器学习之旅必了解:前20名Python人工智能和机器学习开源项目! 如今机器学习和人工智能已经变得家喻户晓,有很多爱好者进入了该领域.但是,什么才是能够进入该领域的正确路径呢?如何保持自己跟 ...

  8. Dataset:数据集集合(CV方向数据集)-常见的计算机视觉图像数据集大集合包括表面缺陷检测数据集(持续更新)

    Dataset:数据集集合(CV方向数据集)-常见的计算机视觉图像数据集大集合包括表面缺陷检测数据集(建议收藏,持续更新) 目录 CV常用数据集平台集合 Mendeley Data CAISA-Web ...

  9. Dataset之CV:人工智能领域数据集集合(计算机视觉CV方向数据集)之常见的计算机视觉图像数据集大集合(包括表面缺陷检测数据集,持续更新)

    Dataset之CV:人工智能领域数据集集合(计算机视觉CV方向数据集)之常见的计算机视觉图像数据集大集合(包括表面缺陷检测数据集,持续更新) 目录 CV常用数据集平台集合 Mendeley Data ...

最新文章

  1. 第九章 Shell信号发送与捕捉
  2. TensorFlow Wide And Deep 模型详解与应用
  3. python整数与IP地址转换
  4. ue4相机_纳格数字创意课程介绍 |UE4虚拟现实技术室内方向
  5. 关于布地奈德的副作用
  6. 玩转mini2440开发板之【64位Ubuntu系统无法运行arm-linux-gcc】
  7. C#接口归纳总结实例详解
  8. java 小题目_java一个小题目
  9. c语言z基本数据类型文档,C语言基本数据类型
  10. python按行拆分表格_Pandas进阶之DataFrame行列拆分
  11. 发票自动处理识别和分类
  12. IEEE Transactions on Vehicular Technology投稿经验分享-1
  13. 翼支付门户CAS单点登录相关介绍
  14. Matlab中如何定义和使用colormap?|colormap的使用
  15. Win10联想电脑连不上wifi解决方法
  16. 自从收了这些Python库 头发都不脱了!
  17. linux硬件时间与系统时间不同步,Linux系统时钟和硬件时钟不一致
  18. 为什么突然变乱码_这样的整理才能结束家里很快变乱的局面。而且整理还能改变运气...
  19. RISC-V、ARM和X86架构
  20. 2018戊戌年运大解析,不看后悔

热门文章

  1. py 的 第 31 天
  2. 重磅!MaxCompute助力阿里开源自研语音识别模型DFSMN,准确率高达96.04%
  3. super的用法(带了解)
  4. TensorFlow——入门基础
  5. Android Studio 编译单个module
  6. jQuery EasyUI 表单插件 - Datebox 日期框
  7. 综合技术 --@Autowired和@Resource
  8. 类似ngnix的多进程监听用例
  9. php时区问题导致php页面显示不正常
  10. 自动驾驶汽车的规划与控制