https://zhuanlan.zhihu.com/p/25138563

分门别类整理了一些网上的免费数据集,这是分类下载地址,希望能节约大家找数据的时间。欢迎数据达人加入QQ群 565136792 交流。

金融

  • 美国劳工部统计局官方发布数据
  • 上证A股日线数据,1999.12.09 至 2016.06.08,前复权,1095支股票
  • 深证A股日线数据,1999.12.09 至 2016.06.08,前复权,1766支股票
  • 深证创业板日线数据,1999.12.09 至 2016.06.08,前复权,510支股票
  • MT4平台外汇交易历史数据
  • Forex平台外汇交易历史数据
  • 几组外汇交易逐笔(Ticks)数据
  • 美国股票新闻数据【Kaggle数据】
  • 美国医疗保险市场数据【Kaggle数据】
  • 美国金融客户投诉数据【Kaggle数据】
  • Lending Club 网贷违约数据【Kaggle数据】
  • 信用卡欺诈数据【Kaggle 数据】
  • 某个金融产品实时交易数据【Kaggle数据】
  • 美国股票数据XBRL【Kaggle数据】
  • 纽约股票交易所数据【Kaggle数据】

交通

  • 2013年纽约出租车行驶数据
  • Udacity自动驾驶数据
  • 纽约 Uber 接客数据 【Kaggle数据】
  • 英国车祸数据(2005-2015)【Kaagle数据】
  • 芝加哥汽车超速数据【Kaggle数据】
  • KITTI 自动驾驶任务数据【数据太大仅有一部分】
  • Cityscapes 场景标注数据【数据太大仅有介绍】

商业

  • Amazon 食品评论数据【Kaggle数据】
  • Amazon 无锁手机评论数据【Kaggle数据】
  • 美国视频游戏销售和评价数据【Kaggle数据】
  • Kaggle 各项竞赛情况数据【Kaggle数据】
  • Airbnb 开放的民宿信息和住客评论数据

推荐系统

  • Netflix 电影评价数据
  • MovieLens 20m 电影推荐数据集
  • WikiLens
  • Jester
  • HetRec2011
  • Book Crossing
  • Large Movie Review
  • Retailrocket 商品评论和推荐数据

医疗健康

  • 人识别物体时大脑核磁共振影像数据
  • 人理解单词时大脑核磁共振影像数据
  • 心脏病心房图像及标注数据
  • 细胞病理识别
  • FIRE 视网膜眼底病变图像数据
  • 食物营养成分数据 【Kaggle数据】
  • EGG 大脑电波形状数据【Kaggle数据】
  • 某人基因序列数据【Kaggle数据】
  • 癌症CT影像数据【Kaggle数据】
  • 软组织肉瘤CT图像数据【Kaggle数据】
  • 美国国家健康与服务部-国家癌症研究所发起的癌症数据仓库介绍【仅有介绍】
  • Data Science Bowl 2017 肺癌识别竞赛数据【数据太大仅有介绍】
  • TCGA-LUAD 肺癌CT图像数据
  • RAID 肺癌CT图像数据

图像数据

综合图像

  • Visual Genome 图像数据
  • Visual7w 图像数据
  • COCO 图像数据
  • SUFR 图像数据
  • ILSVRC 2014 训练数据(ImageNet的一部分)
  • PASCAL Visual Object Classes 2012 图像数据
  • PASCAL Visual Object Classes 2011 图像数据
  • PASCAL Visual Object Classes 2010 图像数据
  • 80 Million Tiny Image 图像数据【数据太大仅有介绍】
  • ImageNet【数据太大仅有介绍】
  • Google Open Images【数据太大仅有介绍】

场景图像

  • Street Scences 图像数据
  • Places2 场景图像数据
  • UCF Google Street View 图像数据
  • SUN 场景图像数据
  • The Celebrity in Places 图像数据

Web标签图像

  • HARRISON 社交标签图像
  • NUS-WIDE 标签图像
  • Visual Synset 标签图像
  • Animals With Attributes 标签图像

人形轮廓图像

  • MPII Human Shape人体轮廓数据
  • Biwi Kinect Head Pose 头部姿势数据
  • 上半身人像数据
  • INRIA Person 数据集

视觉文字识别图像

  • Street View House Number 门牌号图像数据
  • MNIST 手写数字识别图像数据
  • 3D MNIST 数字识别图像数据【Kaggle数据】
  • MediaTeam Document 文档影印和内容数据
  • Text Recognition 文字图像数据
  • NIST Handprinted Forms and Characters 手写英文字符数据
  • NIST Structured Forms Reference Set of Binary Images (SFRS) 图像数据
  • NIST Structured Forms Reference Set of Binary Images (SFRS) II 图像数据

特定一类事物图像

  • 著名的猫图像标注数据
  • Caltech-UCSD Birds200 鸟类图像数据
  • Stanford Car 汽车图像数据
  • Cars 汽车图像数据
  • MIT Cars 汽车图像数据
  • Stanford Cars 汽车图像数据
  • Food-101 美食图像数据
  • 17_Category_Flower 图像数据
  • 102_Category_Flower 图像数据
  • UCI Folio Leaf 图像数据
  • Labeled Fishes in the Wild 鱼类图像
  • 美国 Yelp 点评网站酒店照片
  • CMU-Oxford Sculpture 塑像雕像图像
  • Oxford-IIIT Pet 宠物图像数据
  • Nature Conservancy Fisheries Monitoring 过度捕捞监控图像数据【Kaggle数据】

材质纹理图像

  • CURET 纹理材质图像数据
  • ETHZ Synthesizability 纹理图像数据
  • KTH-TIPS 纹理材质图像数据
  • Describable Textures 纹理图像数据

物体分类图像

  • COIL-20 图像数据
  • COIL-100 图像数据
  • Caltech-101 图像数据
  • Caltech-256 图像数据
  • CIFAR-10 图像数据
  • CIFAR-100 图像数据
  • STL-10 图像数据
  • LabelMe_12_50k图像数据
  • NORB v1.0 图像数据
  • NEC Toy Animal 图像数据
  • iCubWorld 图像分类数据
  • Multi-class 图像分类数据
  • GRAZ 图像分类数据

人脸图像

  • IMDB-WIKI 500k+ 人脸图像、年龄性别数据
  • Labeled Faces in the Wild 人脸数据
  • Extended Yale Face Database B 人脸数据
  • Bao Face 人脸数据
  • DC-IGN 论文人脸数据
  • 300 Face in Wild 图像数据
  • BioID Face 人脸数据
  • CMU Frontal Face Images
  • FDDB_Face Detection Data Set and Benchmark
  • NIST Mugshot Identification Database
  • Faces in the Wild 人脸数据
  • CelebA 名人人脸图像数据
  • VGG Face 人脸图像数据
  • Caltech 10k Web Faces 人脸图像数据

姿势动作图像

  • HMDB_a large human motion database
  • Human Actions and Scenes Dataset
  • Buffy Stickmen V3 人体轮廓识别图像数据
  • Human Pose Evaluator 人体轮廓识别图像数据
  • Buffy pose 人类姿势图像数据
  • VGG Human Pose Estimation 姿势图像标注数据

指纹识别

  • NIST FIGS 指纹识别数据
  • NIST Supplemental Fingerprint Card Data (SFCD) 指纹识别数据
  • NIST Plain and Rolled Images from Paired Fingerprint Cards in 500 pixels per inch 指纹识别数据
  • NIST Plain and Rolled Images from Paired Fingerprint Cards 1000 pixels per inch 指纹识别数据

其它图像数据

  • Visual Question Answering V1.0 图像数据
  • Visual Question Answering V2.0 图像数据

视频数据

综合视频

  • DAVIS_Densely Annotated Video Segmentation 数据
  • YouTube-8M 视频数据集【数据太大仅有介绍】
  • YouTube 网站视频备份【数据太大仅有介绍】

人类动作视频

  • Microsoft Research Action 人类动作视频数据
  • UCF50 Action Recognition 动作识别数据
  • UCF101 Action Recognition 动作识别数据
  • UT-Interaction 人类动作视频数据
  • UCF iPhone 运动中传感器数据
  • UCF YouTube 人类动作视频数据
  • UCF Sport 人类动作视频数据
  • UCF-ARG 人类动作视频数据
  • HMDB 人类动作视频
  • HOLLYWOOD2 人类行为动作视频数据
  • Recognition of human actions 动作视频数据
  • Motion Capture 动作捕捉视频数据
  • SBU Kinect Interaction 肢体动作视频数据

目标检测视频

  • UCSD Pedestrian 行人视频数据
  • Caltech Pedestrian 行人视频数据
  • ETH 行人视频数据
  • INRIA 行人视频数据
  • TudBrussels 行人视频数据
  • Daimler 行人视频数据
  • ALOV++ 物体追踪视频数据

密集人群视频

  • Crowd Counting 高密度人群图像
  • Crowd Segmentation 高密度人群视频数据
  • Tracking in High Density Crowds 高密度人群视频

其它视频

  • Fire Detection 视频数据

音频数据

综合音频

  • Google Audioset 音频数据【数据太大仅有介绍】

语音识别

  • Sinhala TTS 英语语音识别
  • TIMIT 美式英语语音识别数据
  • LibriSpeech ASR corpus 语音数据
  • Room Impulse Response and Noise 语音数据
  • ALFFA 非洲语音数据
  • THUYG-20 维吾尔语语音数据
  • AMI Corpus 语音识别

自然语言处理

  • RCV1英语新闻数据
  • 20news 英语新闻数据
  • First Quora Release Question Pairs 问答数据
  • JRC Names各国语言专有实体名称
  • Multi-Domain Sentiment V2.0
  • LETOR 信息检索数据
  • Yale Youtube Vedio Text
  • 斯坦福问答数据【Kaggle数据】
  • 美国假新闻数据【Kaggle数据】
  • NIPS会议文章信息数据(1987-2016)【Kaggle数据】
  • 2016年美国总统选举辩论数据【Kaggle数据】
  • WikiLinks 跨文档指代语料
  • European Parliament Proceedings Parallel Corpus 机器翻译数据
  • WikiText 英语语义词库数据
  • WMT 2011 News Crawl 机器翻译数据
  • Stanford Sentiment Treebank 词汇数据

社会数据

  • 希拉里邮件门泄露邮件
  • 波士顿 Airbnb 公开数据【Kaggle数据】
  • 世界各国经济发展数据【Kaagle数据】
  • 世界大学排名芝加哥犯罪数据(2001-2017)【Kaagle数据】
  • 世界范围显著地震数据(1965-2016)【Kaagle数据】
  • 美国婴儿姓名数据【Kaagle数据】
  • 全世界鲨鱼袭击人类数据【Kaagle数据】
  • 1908年以来空难数据【Kaagle数据】
  • 2016年美国总统大选数据【Kaagle数据】
  • 2013年美国社区统计数据【Kaagle数据】
  • 2014年美国社区统计数据【Kaagle数据】
  • 2015年美国社区统计数据【Kaagle数据】
  • 欧洲足球运动员赛事表现数据【Kaagle数据】
  • 美国环境污染数据【Kaagle数据】
  • 美国H1-B签证申请数据【Kaggle数据】
  • IMDB五千部电影数据【Kaggle数据】
  • 2015年航班延误和取消数据【Kaggle数据】
  • 凶杀案报告数据【Kaggle数据】
  • 人力资源分析数据【Kaggle数据】
  • 美国费城犯罪数据【Kaggle数据】
  • 安然公司邮件数据【Kaggle数据】
  • 历史棒球数据【Kaggle数据】
  • 美联航 Twitter 用户评论数据【Kaggle数据】
  • 波士顿 Airbnb 公开数据【Kaggle数据】

处理后的科研和竞赛数据

  • NIPS 2003 属性选择竞赛数据
  • 台湾大学林智仁教授处理为 LibSVM 格式的分类建模数据
  • Large-scale 分类建模数据
  • 几个UCI 中 large-scale 分类建模数据
  • Social Computing Data Repository 社交网络数据
数据挖掘机器学习数据集

免费数据集下载(持续更新中...)相关推荐

  1. 【中创】壹起共享“免费”网络资源库-持续更新中

    想找资源又不知道在哪下载?今天整理分享16个可以免费下载的资源库, 从学习资源,电影,动漫,实用工具,大学考研,软件下载,素材资源,大学资源,网盘资源,网易,极客等...用到的各个类目的课件都能找到, ...

  2. 常用CV数据集(持续更新中)

    图像数据集: 1.MNIST MNIST数据集官网 入门级的数据集,相信很多学习AI的人使用的第一个数据集就是MNIST. NIST的全称是National Institute of Standard ...

  3. 【地图匹配(ST-matching)】GPS 轨迹数据预处理——T-Driver数据集【持续更新中】

    一.数据介绍 1.数据链接 https://download.csdn.net/download/skyman30/87432266?spm=1001.2014.3001.5503https://do ...

  4. 开源工业缺陷数据集汇总,持续更新中(已更新28个)

    欢迎大家关注我的公众号:一刻AI 本文目前汇总了常见的28个开源工业缺陷数据集,持续更新中 (欢迎大家留言补充,共同建设一个为大家提供便利的文章) 东北大学热轧带钢表面缺陷数据集 官方链接:Visio ...

  5. cocos2d-html5 游戏实战源代码大集合和下载(包括flappy,popstar等----持续更新中----)...

    cocos2d-html5 游戏实战源代码大集合和下载(包括flappy,popstar等----持续更新中----) 诚邀您来使用首页新闻日历功能! cocos2dx editor是高效开发跨平台的 ...

  6. 一个免费下拉关键词SEO小工具(持续更新中...)

    一个免费下拉关键词SEO小工具(持续更新中...) 帮助链接:转接 后续功能: 支持界面设置关键词 支持后台运行

  7. html模板下载之“门户网站html模板页面下载”——html模板下载合集(持续更新中)

    整理了一部分html模板下载(持续更新中),特别适合实训项目,毕业设计项目使用. 有些是积分的(绿色标题)有些是vip资源(黑色标题)哈 1.tml模板下载自行车综合资讯门户网站html模板是一款适合 ...

  8. Cisco 产品下载链接汇总 2023 持续更新中

    Cisco 产品链接汇总 2023 持续更新中 IOS-XE, IOS-XR, NX-OS & FXOS based on linux kernel 请访问原文链接:https://sysin ...

  9. 嵌入式相关开源项目、库、资料------持续更新中

    学习初期最难找的就是找学习资料了,本贴精心汇总了一些嵌入式相关资源,包括但不限于编程语言.单片机.开源项目.物联网.操作系统.Linux.计算机等资源,并且在不断地更新中,致力于打造全网最全的嵌入式资 ...

  10. 面试1:Java、微服务、架构常见面试题(持续更新中)

    Java.微服务.架构常见面试题(持续更新中) 文章目录 Java.微服务.架构常见面试题(持续更新中) ==**Java**== 1.Java概述 (1)JVM.JRE和JDK (2)Java特点 ...

最新文章

  1. 余额 微信钱包图片_微信储值会员卡小程序,微信会员卡功能系统。
  2. 编写配置文件不能出现帮助信息
  3. 【MATLAB】绘图技巧(4)——网格线与边框线控制
  4. 模拟spring IOC、源码分析
  5. linux之内核剖析
  6. 自然水体辐射特性与数值模拟 pdf_自然科学基金|水下消油剂处理对海底溢油输移扩散的影响实验及数值模拟研究...
  7. linux 路由表及路由设置
  8. jmeter压力测试
  9. 产品经理日常工作之流程图
  10. 一图掌握ICT项目管理流程图「实例」
  11. 利用python制作词云图
  12. 西门子实数转整数_怎样将实数转换成整数
  13. narwal机器人_NARWAL云鲸智能扫拖机器人,海外Kickstarter众筹销量第一
  14. Trying to start MapKit location updates without prompting for location authorization. Must call -[CL
  15. skywalking实战--agent异常日志监控
  16. 用windbg内核模式调试用户态程序
  17. C++ 文本编码探测CED (Compact Encoding Detection)技术
  18. G - 。。。。。。。
  19. TCP的三次握手与四次挥手理解及面试题(很全面)
  20. 我们最常看到的世界地图并不真实-墨卡托投影理解

热门文章

  1. 天体物理学-星际穿越
  2. 深夜分享建站过程---我的启示录
  3. 淘淘商城第95讲——单点登录之用户注册
  4. 论文笔记31 -- (ReID)【ICCV2021】TransReID: Transformer-based Object Re-Identification
  5. 2022ICPC网络赛第一场-A 01 Sequence
  6. 戴尔台式计算机规格型号怎么查,戴尔台式机型号怎么样查看
  7. C语言 求pow()函数,x的y次方
  8. 巴菲特致股东的一封信:1986年
  9. android闹钟 失效,Android闹钟启动时间设置无效问题的解决方法
  10. Java之马里奥游戏完整版