整理 | suiling

出品 | AI科技大本营(ID:rgznai100)

对于从事机器学习的小伙伴来说,机器学习必须以大量的数据为基础,否则构建再好的模型也不能达到你想要的效果。同时,不同质量的数据集也会影响到模型训练的效果。之前营长就为大家推荐过一款机器学习数据集集合项目,如今该项目的作者已经如他所言更新内容啦!不信你看~

该项目包含了计算机视觉、自然语言处理、医疗等数据集,此外作者还很贴心地放上了每个数据集的时间、描述以及相关的Paper。

以下是该列表中的部分数据集

  • 计算机视觉数据集

  • 自然语言处理数据集

  • 问答数据集

  • 医疗数据集

更详尽的数据集列表,请见:https://www.datasetlist.com/

下边给大家推荐两个查找数据集的网站:

  • UCI machine learning repository:https://wordnet.princeton.edu/

UCI数据集是一个常用的机器学习标准测试数据集,经常出现在各种机器学习论文当中。

关于如何使用该数据集,可参考CSDN博客上的一篇文章:https://blog.csdn.net/qq_32892383/article/details/82225663

  • Kaggle datasets:https://www.kaggle.com/datasets

Kaggle,一个数据科学竞赛网站,大家都很熟悉了。

另外,营长此前也整理过一些数据集,一起分享给你。

  • 68款大规模机器学习数据集,涵盖CV、语音、NLP | 十年资源集

  • 上班时间请勿打开,158万张鉴黄图片数据集来喽~

  • 秘籍 | 机器学习数据集网址大全

  • 百度Apollo发布海量自动驾驶数据集

  • 1400小时开源语音数据集,你想要都在这儿

  • 腾讯AI Lab开源业内最大规模多标签图像数据集(附下载地址)

今日QA:什么样的数据集算是好的数据集?欢迎在评论区留言。

(*本文由 AI科技大本营整理,转载请联系微信1092722531)

精彩推荐

「2019 Python开发者日」精彩日程全揭晓~这一次我们依然“只讲技术,拒绝空谈”10余位一线Python技术专家共同打造一场硬核技术大会。更有深度培训实操环节,为开发者们带来更多深度实战机会。更多详细信息请咨询13581782348(微信同号)。

80+机器学习数据集,还不快收藏相关推荐

  1. 概要设计 英文_互联网知识大全:软件开发中和文档常见的英文缩写,还不快收藏...

    概要设计 英文_互联网知识大全:软件开发中和文档常见的英文缩写,还不快收藏... https://blog.csdn.net/weixin_39914243/article/details/11123 ...

  2. 资源 | 来自独秀同学的深度网络数学笔记,还不快收藏?

    来源:机器之心 本文共3215字,建议阅读6分钟. 本文作者花时间学习了隐藏在模型背后的数学原理,并对一些概念进行了梳理,包括神经网络.单个神经元.激活函数.损失函数等基本概念,比较容易理解. [ 导 ...

  3. 史上最全报表教程,还不快收藏!

    做报表这件事外人听起来简单,但只有做过的人才知道,真正做起来很难. 做数据分析已经很多年的我,准备把过往的方法论整理一下,这篇史上最全报表教程,希望大家都收藏一下. 报表教程一:了解常用的3种报表类型 ...

  4. 四款画风清奇的减压小工具,资深职场员工的推荐,还不快收藏

    作为一个职场人员经常听到身边的朋友向自己抱怨,自己的工作压力太大了,怎么办?确实在如今这个快节奏的生活里,每个人都会因为身上的压力过大而导致自己生活的不如意. 那么我们该如何的解压呢?小编今天就来和大 ...

  5. 打工人都想知道的免费音频转文字软件分享,还不快收藏

    大家平常看电影.杂评时,会不会一边动笔抄录其中的名言警句呢?虽说好记性不如烂笔头,但当我们遇上金句集锦.囊括多段人生哲理的影剧时,反复地暂停播放进行誊抄是不是也挺费劲的呢?其实,我们大可以用一些识别. ...

  6. 自媒体必备配音剪辑软件,还不快收藏!

    现在自媒体成为趋势,越来越多的人想成为视频博主,但不知道做好了视频应该要怎么配音?不知道大家平时刷视频的时候有没有发现,现在很多短视频都会用到配音,一个有趣好听有情感的配音可以为自己的视频配音增加亮点 ...

  7. c++opencv汉字分割_机器学习小白,还不快pick一下——【视觉与图像:阈值分割】...

    " 前言:安利Python来开发OpenCV的原因其实细心的小伙伴早在?[视觉与图像]Python+OpenCV教程入门篇就找到了想要的答案.(点蓝字即可打开) " 今天周五了! ...

  8. 【收藏】机器学习数据集列表:你需要收藏!

    ↑ 点击上方[计算机视觉联盟]关注我们 来源:Medium 编辑:三石 来自新智元 下面的ML大型数据集,总有一款适合你. 就目前来看,找到一个特定的数据集来解决各种机器学习问题,甚至进行实验还是比较 ...

  9. 收藏 | 机器学习数据集汇总收集

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 仅作分享,不代表本公众号立场,侵权联系删除 转载于:机器学习算法与 ...

最新文章

  1. Python中使用pip install ncmbot时各种错误解决办法
  2. stm32延时us寄存器_STM32延时函数的四种方法
  3. leetcode - Balanced Binary Tree
  4. 【推导】【数学期望】Gym - 101237D - Short Enough Task
  5. SC/Tetra.v7-ISO 1DVD(流体模拟分析)
  6. 使用 PyQT5 来做一个简易版库存管理系统(二)
  7. y480 linux无线网卡驱动,联想y480无线网卡驱动下载-联想y480笔记本网卡驱动v15.0.0.75 官方版 - 极光下载站...
  8. 【辅助开发】游戏辅助开发全流程-golang
  9. 支付宝芝麻信用免押金领取POS机、信用免押租赁系统开发
  10. Bin格式文件结构及其查看工具
  11. 服务器装系统报0x0000005d,安装Win8系统提示Error Code:0x0000005D错误怎么办
  12. html+css基础教程学习之css连接
  13. 计算机算术3-整数加减法(前缀加法器)
  14. 当我们与某远程网络连接不上时,就需要跟踪路由查看,以便 了解在网络的什么位置出现了问题,满足该目的的命令是
  15. fm24c16c语言程序,单片机读写24C01~24C16程序
  16. 微信气泡主题设置_微信气泡主题设置方法
  17. FPGA设计编程(二) 8-3线优先编码器与3-8线译码器
  18. Java工程师考试题
  19. 【VB编程】05.MsgBox与InputBox函数
  20. Python怎么买入卖出

热门文章

  1. HQL中的Like查询需要注意的地方
  2. SiteMapPath基本用法
  3. rhel6用centos163 yum源
  4. 字符串还可以这样初始化--uboot篇
  5. 常用的 linux命令
  6. 正则表达式的基本入门
  7. AngularJs $cacheFactory 缓存服务
  8. 使用java的Calendar对象获得当前日期的上几个度开始、结束时间
  9. 如何运用下载来的模板
  10. 如何设置matplotlib中x,y坐标轴的位置?