数据挖掘的数据集资源
转载自:http://www.cnblogs.com/bobomouse/archive/2007/05/26/760513.html
1、气候监测数据集 http://cdiac.ornl.gov/ftp/ndp026b
2、几个实用的测试数据集下载的网站
http://www.cs.toronto.edu/~roweis/data.html
http://www.cs.toronto.edu/~roweis/data.html
http://kdd.ics.uci.edu/summary.task.type.html
http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-20/www/data/
http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/
http://www.phys.uni.torun.pl/~duch/software.html
在下面的网址可以找到reuters数据集http://www.research.att.com/~lewis/reuters21578.html
以下网址上有各种数据集:
http://kdd.ics.uci.edu/summary.data.type.html
进行文本分类,还有一个数据集是可以用的,即rainbow的数据集
http://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html
3、找了很多测试数据集,写论文的同志们肯定需要的,至少能用来检验算法的效果
可能有一些不能访问,但是总有能访问的吧:
UCI收集的机器学习数据集
ftp://pami.sjtu.edu.cn/
http://www.ics.uci.edu/~mlearn//MLRepository.htm
statlib
http://liama.ia.ac.cn/SCILAB/scilabindexgb.htm
http://lib.stat.cmu.edu/
样本数据库
http://kdd.ics.uci.edu/
http://www.ics.uci.edu/~mlearn/MLRepository.html
关于基金的数据挖掘的网站
http://www.gotofund.com/index.asp
http://lans.ece.utexas.edu/~strehl/
reuters数据集
http://www.research.att.com/~lewis/reuters21578.html
进行文本分类&WEB
http://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html
时间序列数据的网址
http://www.stat.wisc.edu/~reinsel/bjr-data/
apriori算法的测试数据
http://www.almaden.ibm.com/cs/quest/syndata.html
癌症基因:
http://www.broad.mit.edu/cgi-bin/cancer/datasets.cgi
金融数据:
http://lisp.vse.cz/pkdd99/Challenge/chall.htm
另一个人提供的
http://www.cs.toronto.edu/~roweis/data.html
http://kdd.ics.uci.edu/summary.task.type.html
http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-20/www/data/
http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/
http://www.phys.uni.torun.pl/~duch/software.html
在下面的网址可以找到reuters数据集
http://www.research.att.com/~lewis/reuters21578.html
以下网址上有各种数据集:
http://kdd.ics.uci.edu/summary.data.type.html
进行文本分类,还有一个数据集是可以用的,即rainbow的数据集
http://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html
Download the Financial Data (~17.5M zipped file, ~67M unzipped data)
Download the Medical Data (~2M zipped file, ~6M unzipped data)
http://lisp.vse.cz/pkdd99/Challenge/chall.htm
kdnuggets 相关链接数据集:
http://www.kdnuggets.com/datasets/index.html
还有另外一个很好的资源网址为:http://kdd.ics.uci.edu/,里面包含的数据资源如下(按应用领域划分):
Direct Marketing
KDD CUP 1998 Data
GIS
Forest CoverType
Indexing
Corel Image Features
Pseudo Periodic Synthetic Time Series
Intrusion Detection
KDD CUP 1999 Data
Process Control
Synthetic Control Chart Time Series
Recommendation Systems
Entree Chicago Recommendation Data
Robots
Pioneer-1 Mobile Robot Data
Robot Execution Failures
Sign Language Recognition
Australian Sign Language Data
High-quality Australian Sign Language Data
Text Categorization
20 Newsgroups Data
Reuters-21578 Text Categorization Collection
NSF Research Awards Abstracts 199 0-2003
World Wide Web
Microsoft Anonymous Web Data
MSNBC Anonymous Web Data
Syskill Webert Web Data
这里又找到一个,在一个老外的blog上找到的。(儿童节前一天)
http://www.fs.fed.us/fire/fuelman/
数据挖掘的数据集资源相关推荐
- 转:UCI数据集和源代码数据挖掘的数据集资源
<UCI数据集和源代码> UCI数据集是一个常用的标准测试数据集,下载地址在 http://www.ics.uci.edu/~mlearn/MLRepository.html 我的主页上也 ...
- UCI数据集和源代码数据挖掘的数据集资源
<UCI数据集和源代码> UCI数据集是一个常用的标准测试数据集,下载地址在 http://www.ics.uci.edu/~mlearn/MLRepository.html 我的主页上也 ...
- 人工智能大数据,公开的海量数据集下载,ImageNet数据集下载,数据挖掘机器学习数据集下载...
人工智能大数据,公开的海量数据集下载,ImageNet数据集下载,数据挖掘机器学习数据集下载 ImageNet挑战赛中超越人类的计算机视觉系统 微软亚洲研究院视觉计算组基于深度卷积神经网络(CNN)的 ...
- 人工智能大数据,公开的海量数据集下载,ImageNet数据集下载,数据挖掘机器学习数据集下载
人工智能大数据,公开的海量数据集下载,ImageNet数据集下载,数据挖掘机器学习数据集下载 ImageNet挑战赛中超越人类的计算机视觉系统 微软亚洲研究院视觉计算组基于深度卷积神经网络(CNN)的 ...
- 8种寻找机器学习数据集的方法 | 附数据集资源
乾明 发自 凹非寺 量子位 出品 | 公众号 QbitAI 在训练机器学习模型时,找到合适的数据集一直是个棘手的问题. 近日,亚马逊AWS高级技术顾问Will Badr介绍了8种寻找机器学习数据集的方 ...
- 深度学习中常见的打标签工具和数据集资源
深度学习中常见的打标签工具和数据集资源 一.打标签工具 1. labelimg/labelme 1.1 搭建图片标注环境(win10) (1) 安装anaconda3 (2) 在anaconda环境p ...
- 大数据挖掘课程案例资源介绍
大数据挖掘课程案例资源分为[基础]版,[进阶]版,不同阶段的课程难易程度不一样,对学生的基础知识掌握要求也不一样. [基础]Python编程基础 通过学习本 ...
- 多目标跟踪(MOT)数据集资源整理分享
我们已经生活在一个被摄像头和视频包围的世界里,从手机.汽车.无人机到各类监控设备,随处可见摄像头的"身影".据前瞻产业研究院2020年的报告分析,预计到2025年全球摄像头镜头的出 ...
- AI深度、机器学习数据集资源汇总
文章目录 前言 一.数据集网站 二.具体数据集 1.记录的具体数据集 2.医疗图像 3.网上数据集汇总链接 总结 前言 继续收集.更新.汇总....................... 一.数据集网 ...
最新文章
- 【OCP新题库】052最新题库解析-第5题
- python交互式程序设计导论第二周_沧州学堂云Python 交互式程序设计导论搜题公众号...
- [armv8-arch64]linux kernel 5.9的异常量表介绍(irq,fiq,sync,svc)
- Vim安装、配置和插件的添加使用(可以以目录的形式打开)
- 为爱追寻_从机械师到编码员:追寻梦想如何改变了我的生活
- linux mysql 安装innodb_在ubuntu Mysql 5.7 安装InnoDB Memcached 插件
- 数据结构之树的定义及操作
- 不玩了?王思聪退出香蕉娱乐董事长职务,麻闻多接任
- C++ double转CStringW/LPCWSTR
- tree.js 制作酷炫照片墙
- Dirt Ratio HDU - 6070
- docker用现有容器创建镜像
- JDF的实质与走向(转)
- 手机淘宝——flexible.js 移动端自适应方案
- 《计算机学报》征稿简则
- 打印幻灯片去掉空白边缘
- tensorflow中对lstm及双向lstm的理解
- Github常用英文翻译
- Android开发艺术探索--第二章IPC机制(2)之Binder
- 脖子为什么越按越疼?
热门文章
- Windows11升级绕过不支持该处理器
- C语言之指针本身地址与指针向的地址(四十四)
- cscope索引软链接解决方法
- 集成Android免费语音合成功能(在线、离线、离在线融合),有这一篇文章就够了(离线)
- 蓝牙avrcp协议源码分析
- 人人都应该学习并成为优秀的产品经理,因为你要为《你自己》这个产品负责到底
- 深度学习自学(三十二):半监督焦点人物检测
- hrrn算法java_常用的调度算法
- windows查看器无法打开图片_Win7自带图片查看器异常
- 威纶通宏开机后使用初始化宏指令_你按下电脑开机键后,电脑都干了些什么?...