人工智能的无名英雄就是数据,许多许多标注或未标注的数据。研究部门和公司也都认识到数据民主化是加快人工智能的必要步骤。事实上,我们很难用一篇文章来说明哪些开放数据集是有用的,那么深度学习数据集怎么找?本文介绍了我在深度学习科研中(不是工程实践)寻找数据集的方法。仅供参考,欢迎指正。

深度学习数据集怎么找?

这个问题可以等价为:如何判断一个数据集是否合适使用?

通常“找数据集”和“找课题、方向”是相辅相成的(如果希望自己的代码有横向对比)

1.确定大致方向

2.浏览一下该方向最知名的数据集的形式

3.确定一个具体方向,并保证至少有一个数据集可用

  • 何为可用?
  • 数据量是否够大
  • 数据集是否够新(5年内,除非是理论研究)
  • 是否足够多人使用(论文)
  • 数据采集是否合理
  • 标注格式是否好用
  • 问题场景是否满足研究要求
  • 数据是否可以下载

4.寻找更多的数据集,当有3个或更多数据集的时候

  • 判断其他课题是否已经使用其中的数据集,尽量选择共同数据集
  • 判断数据集的标注是否支持更多的任务,尽量选择多任务数据集
  • 判断实验室的算力和自己算法的性能是否可以驱动这个数据集
  • 判断哪个的问题场景最贴切
  • 判断数据集近年来的指标上升速度是否够快(10%+/年是理想状态,5%+/年则可做,新数据集也可做)

免费分享一些我整理的人工智能学习资料给大家,包括一些AI常用框架实战视频、图像识别、OpenCV、NLQ、机器学习、pytorch、计算机视觉、深度学习与神经网络等视频、课件源码、国内外知名精华资源、AI热门论文、行业报告等。

为了更好的系统学习AI,推荐大家收藏一份。

下面是部分截图,文末附免费下载方式。

一、人工智能课程及项目

二、国内外知名精华资源

三、人工智能论文合集

四、人工智能行业报告

学好人工智能,要多看书,多动手,多实践,要想提高自己的水平,一定要学会沉下心来慢慢的系统学习,最终才能有所收获。

点击下方名片,扫码免费下载文中资料。

深度学习数据集怎么找?相关推荐

  1. 捡漏!用谷歌图片搜索自制深度学习数据集 | 教程

    铜灵 编译整理 量子位 出品 | 公众号 QbitAI 就怕前脚刚立志搞个新研究,后脚就发现没有合适的数据集可用.AI工程师从入门到放弃,可能就是这么一会的功夫. 别找了,现在深度学习数据集也能自制了 ...

  2. 深度学习数据集标注工具、图像语料数据库等资源

    NLP+VS︱深度学习数据集标注工具.图像语料数据库.实验室搜索ing... 2017年02月07日 12:12:01 阅读数:27032 ~~因为不太会使用opencv.matlab工具,所以在找一 ...

  3. 【图像标注】NLP+VS︱深度学习数据集标注工具、图像语料数据库、实验室搜索ing

    因为不太会使用opencv.matlab工具,所以在找一些比较简单的工具.  .  . 一.NLP标注工具BRAT BRAT是一个基于web的文本标注工具,主要用于对文本的结构化标注,用BRAT生成的 ...

  4. 深度学习数据集定义与加载

    深度学习数据集定义与加载 深度学习模型在训练时需要大量的数据来完成模型调优,这个过程均是数字的计算,无法直接使用原始图片和文本等来完成计算.因此与需要对原始的各种数据文件进行处理,转换成深度学习模型可 ...

  5. 深度学习数据集制作工作_创建我的第一个深度学习+数据科学工作站

    深度学习数据集制作工作 My Home Setup 我的家庭设置 Creating my workstation has been a dream for me, if nothing else. 创 ...

  6. 深度学习数据集的准备

    深度学习数据集的准备 下面介绍一个做了很久的项目,其中最简单的一部分是将该乳腺X线数据集进行有病没病的分类训练,说到训练最基本的就是数据集的准备,在这里先讲讲数据集怎么准备.下图是原始数据集的一部分. ...

  7. NLP+VS︱深度学习数据集标注工具、图像语料数据库、实验室搜索ing..

    一.NLP标注工具 来源:<构想:中文文本标注工具(附开源文本标注工具列表)> Chinese-Annotator   来源:https://github.com/crownpku/Chi ...

  8. NLP+VS︱深度学习数据集标注工具、图像语料数据库、实验室搜索ing....

    from: https://blog.csdn.net/sinat_26917383/article/details/54908389 一.NLP标注工具 来源:<构想:中文文本标注工具(附开源 ...

  9. 准确率99.9%!如何用深度学习最快找出放倒的那张X光胸片(代码+数据)

    医学图像数据的质量一直是个老大难题.难以清理的数据制约着许多深度学习的应用. 而实际上,深度学习本身就是清洗医疗数据的好帮手. 今天,我们就来讲一个案例,展示如何用深度学习迅速清洗一个杂乱的医疗图像数 ...

最新文章

  1. python 类属性及限制
  2. DP(01背包) UESTC 1218 Pick The Sticks (15CCPC C)
  3. Error: Cannot find module '@babel/core'
  4. 力扣151. 翻转字符串里的单词
  5. javascript中的命名规则和方法
  6. 3.MongoDB数据查询
  7. python多进程队列中的队列_python 多进程队列数据处理详解
  8. 传感器怎么获取障碍物的宽度信息_机器人感知 -- 测距传感器
  9. 微信公众号调用腾讯地图api
  10. PayPal 支付接口詳解
  11. igbt原理动画演示视频_简单易懂的IGBT工作原理分析
  12. 激光电视的优缺点说明,激光电视与投影有什么区别
  13. python求共轭复数_python怎么print出共轭复数
  14. 什么是Kodu---Kodu少儿编程第一天
  15. QT(6)-QStandardItemModel
  16. Switch 无法 关联账号 this page cannot be displayed
  17. 学习java随堂练习-20220617
  18. 阿里云服务器配置Tomcat
  19. Xcode-关于切换窗口的快捷键
  20. 各种奇葩3389连接不上的解决方法

热门文章

  1. TMPGEnc 4.0 XPress(小日本4)优化安装教程
  2. java太臃肿_Java简洁开发技巧,减少繁琐臃肿的代码
  3. ps -ef|grep tomcat是啥意思呢?(☆)
  4. 诸葛亮为什么难以入围千古名相之列
  5. 没有996的当代年轻人,配过怎样的生活
  6. 过电流继电器怎么正确选型
  7. 机器人咔嚓的音效_监听咔嚓声检测机器人装配线的故障发生
  8. 在Linux中Realplay 10.0 的安装和使用(转)
  9. Excel Application对象应用大全(四)
  10. 5个好用的视频素材网站