文章目录

  • 一、前言
  • 二、分类常用数据集
    • (1)海伦约会
    • (2)iris鸢尾花数据集
    • (3)垃圾邮件过滤
    • (4)cifar10/100数据集
    • (6)mnist数据集
  • 三、聚类常用数据集
    • (1)Kmean-dataset
  • 四、回归常用数据集
    • (1)Boston房屋价格预测
  • 五、分割常用数据集
    • (1)视网膜血管
    • (2)LIST2017
  • 六、其他数据集
    • (1)FERET_80_80人脸数据库
    • (2)FACES人脸数据库

一、前言

  数据集不定时更新,欢迎大家分享更多的数据集,若数据集分享链接失效的话,可评论或私聊博主,还有…emmmm, 制造不易,点个赞再走把!!
  最后一次更新日期:2020.6.25

二、分类常用数据集

(1)海伦约会

样本数据特征: 1.每年获得的飞行常客里程数
        2.玩视频游戏所消耗事件百分比
        3.每周消费的冰激凌公升数

样本标签值:  1.不喜欢的人
        2.魅力一般的人
        3.极具魅力的人

数据集格式: txt文件

 百度网盘链接:海伦约会数据集
 提取码:xgm6

(2)iris鸢尾花数据集

样本数据特征: 1.Sepal.Length(花萼长度)
        2.Sepal.Width(花萼宽度)
        3.Petal.Length(花瓣长度)
        4.Petal.Width(花瓣宽度)

样本标签值:  1.setosa
        2.versicolor
        3.virginica

数据集格式: csv文件

 百度网盘链接:iris鸢尾花数据集
 提取码:5m0q

(3)垃圾邮件过滤

数据集说明: 数据集下包含两个文件夹,其中spam文件夹下为垃圾邮件,ham文件夹下为非垃圾邮件。

数据集格式: txt文件

 百度网盘链接:垃圾邮件过滤
 提取码:3pny

(4)cifar10/100数据集

cifar10数据集说明:由10个类的60000个32x32彩色图像组成,每个类有6000个图像。 有50000个训练图像和10000个测试图像。数据集分为五个训练批次和一个测试批次,每个批次有10000个图像。测试批次包含来自每个类别的恰好1000个随机选择的图像。

数据集类型:python版本

说明:其中readme.html文件下包含Matlab和binary两个版本的下载,以及包含cifar100的下载链接,需要者可自行下载。

 百度网盘链接:cifar10/100数据集下载
 提取码:diwr

(6)mnist数据集

cifar10数据集说明:MNIST数据集由60000个训练样本和10000个测试样本组成,每个样本都是一张28 * 28像素的灰度手写数字图片。

数据集格式:.pkl文件、.txt文件(binary)、.rar文件(image)

 百度网盘链接:pkl格式mnist数据集
 提取码:cd5i

 百度网盘链接:txt格式mnist数据集
 提取码:an60

 百度网盘链接:rar格式mnist数据集
 提取码:4ehe

三、聚类常用数据集

(1)Kmean-dataset

说明:此数据集为编写Kmeans算法时, 创造的简易数据集,包含四个特征值,有需要的朋友可以自取。

数据集格式: txt文件

 百度网盘链接:Kmeans算法数据集
 提取码:891h

四、回归常用数据集

(1)Boston房屋价格预测

样本数据特征: 1.CRIM: 城镇人均犯罪率
        2.ZN: 住宅用地超过 25000 sq.ft. 的比例
        3.CHAS: 查理斯河空变量(如果边界是河流,则为1;否则为0)
        4.NOX: 一氧化氮浓度
        5.RM: 住宅平均房间数
        6.AGE: 1940 年之前建成的自用房屋比例
        7.DIS: 到波士顿五个中心区域的加权距离
        8.RAD: 辐射性公路的接近指数
        9.TAX: 每 10000 美元的全值财产税率
        10.PTRATIO: 城镇师生比例
        11.B: 1000(Bk-0.63)^ 2,其中 Bk 指代城镇中黑人的比例
        12.LSTAT: 人口中地位低下者的比例

样本target:  MEDV:自住房的平均房价,以千美元计

数据集格式: txt文件

 百度网盘链接:Boston房屋价格预测数据集
 提取码:svet

五、分割常用数据集

(1)视网膜血管

训练集: 共二十张图片(含标记)

测试集:  共二十张图片(含标记)

训练集具体说明:  视网膜血管数据集说明

数据集格式: 图片文件

 百度网盘链接:DRIVE视网膜血管数据集
 提取码:driv

(2)LIST2017

训练集具体说明:  LIST2017肝脏肿瘤分割挑战数据集

数据集格式: .nii CT图像

 百度网盘链接:LIST2017数据集
 提取码:LIST

六、其他数据集

(1)FERET_80_80人脸数据库

数据集说明: 200个人脸数据,每个人脸数据包含7张图片,每张图片大小为80*80

数据集格式: 图片为tif格式

 百度网盘链接:FERET_80_80人脸数据库
 提取码:70c6

(2)FACES人脸数据库

数据集说明: 包括不同人在不同环境下的彩色图片若干张,由于下载的数据集未作整理规划,需要的人可自取。

数据集格式: 图片为jpg格式

 百度网盘链接:FACES人脸数据库
 提取码:g5m5

机器学习/深度学习常用数据集归纳(附百度网盘链接)相关推荐

  1. python3人工智能网盘_《Python3入门人工智能掌握机器学习+深度学习提升实战能力》百度云网盘资源分享下载[MP4/5.77GB]...

    内容简介 本资源为<Python3入门人工智能掌握机器学习+深度学习提升实战能力>百度云网盘资源分享下载,具体看下文目录,格式为MP4/5.77GB.本资源已做压缩包处理,请勿直接在百度网 ...

  2. java的jdk安装教程附百度网盘链接环境配置遇到的各种问题版本选择

    首先关于JDK版本的选择–附百度网盘链接 现在互联网行业各家公司大部分使用的是jdk8.0(也被叫做jdk1.8,有兴趣的话可以去百度以下jdk演变历史)虽然现在jdk更新到11版本了,但是不建议使用 ...

  3. 如何安装配置JDK(保姆级完美解决教程+附百度网盘链接)

    JDK种类繁多,在这里我以JDK14为例,为什么以JDK14为例呢?当然是为了破解白嫖idea2020旗舰版.^_^^_^(如果大家感兴趣,我后续会一个教程)     首先去甲骨文官方网站下载JDK1 ...

  4. Android Studio 1.0 正式版下载(另附百度网盘链接)

    众所周知,想要访问Android官网还是不容易的,这里我把那个页面复制过来了,里面带有需要的链接.其实只要把该链接离线到百度网盘即可(或者使用我已的百度网盘链接),或者用迅雷来下载,速度还是挺快的. ...

  5. Potsdam,Vaihingen数据集(附百度网盘下载地址)

    遥感数据集Potsdam,Vaihingen 的分享及处理 1. Potsdam,Vaihingen数据集下载地址(百度网盘) 2. 数据集分割处理 1)分割图片 2)保存为.mat格式 1. Pot ...

  6. 自己在学习的基本java开发电子书(附百度网盘链接)

    1.Spring 3.x企业应用开发实战 链接:https://pan.baidu.com/s/1L7IjOiZ4gozSuTgrl3k33Q      提取码:8k03 (附封面) 2.跟我学Spr ...

  7. 深度学习常用数据集介绍与下载(附网盘链接)

    摘要 这篇博文总结了博主收集的深度学习常用的数据集,包含常用的分类.目标检测及人脸识别任务,对每个数据集给出了简要介绍.官网下载网站以及公众号获取的关键字.因为有的数据集较大,官网的下载速度可能比较慢 ...

  8. kitti数据集简介、百度网盘分享 kitti-object、kitti-tracking 全套数据集 自动驾驶

    0 写在前面 最近在学习MOT相关知识,之前暑期实习是在一家自动驾驶公司,公司资料里已经有了kitti数据集,所以直接用的,并没有去下载.但是最近自己在学校也用到了这个数据集,所以就去官网下载了,结果 ...

  9. 手写数字识别MNIST数据集下载百度网盘链接快速下载

    介绍 MNIST数据集是机器学习领域中非常经典的一个数据集,由60000个训练样本和10000个测试样本组成,每个样本都是一张28 * 28像素的灰度手写数字图片. 下载 官方链接:http://ya ...

  10. 自制批量 PDF 转图片的工具软件(附百度网盘地址)

    下载地址已经失效,请看最新文章! 自制批量 PDF 转图片的工具软件(附百度网盘地址) 闲的蛋疼,做了一个批量把PDF文件转为图片的工具软件,选择PDF文件所在的文件夹就可以了,它会自动搜寻该目录下面 ...

最新文章

  1. 博客园模板 样式优化
  2. ubuntu启动时自动挂载windows分区
  3. 西门子逻辑运算指令_西门子S7-300PLC逻辑运算指令
  4. linux开端口不重启,Linux 防火墙开放端口(有时不生效可能是没有保存、重启导致)...
  5. python基于happybase对hbase增删改查-thrift1
  6. access和mysql4注入小技巧
  7. 学术族谱典型用户及典型场景模拟
  8. javaScript中的Object类型
  9. 半导体行业半双工(HDX)低频工业RFID读写器|读卡器CK-S640-AP60E之MODBUS TCP 协议说明
  10. ruby rake学习
  11. php cms 301,www域名301
  12. C语言解数独(含源码) 2020/8/19
  13. 如果电脑蓝屏0xc000021a怎么办
  14. 测试-------性能测试(一)
  15. 读《Halting in Random Walk Kernels》
  16. 《Spring事务传播行为详解》经典例子 看完这篇,别的不用看了
  17. 第六章 样本与抽样分布
  18. java毕业设计物资物流管理系统Mybatis+系统+数据库+调试部署
  19. (分享) 英语邮件要点
  20. Matlab 图像傅里叶变换

热门文章

  1. win10下的MyEclipse2017 ci7 破解教程+全套资源+失败处理
  2. 安装惠普M1136打印机一直处于“新设备已连接”状态怎么办?
  3. 极品飞车最高通缉Ps2的秘籍
  4. PowerDesigner将PDM导出生成WORD文档(rtf文档)
  5. NoteExpress 学校集团版本 校园网导入EI题录
  6. java时间数字转换成大写显示
  7. 只用测试号或认证服务号,实现电脑PC浏览器扫码微信扫码二维码登陆的思路,无需开放平台
  8. 什么是静态测试、动态测试、黑盒测试、白盒测试、α测试 β测试?
  9. 萤石云设备下线是什么导致的_萤石设备突然看不了,提示不在线怎么办?
  10. 【python】将图片格式转换为RGB格式