转载自:http://www.cnblogs.com/bobomouse/archive/2007/05/26/760513.html

1、气候监测数据集 http://cdiac.ornl.gov/ftp/ndp026b

2、几个实用的测试数据集下载的网站

http://www.cs.toronto.edu/~roweis/data.html
http://www.cs.toronto.edu/~roweis/data.html
http://kdd.ics.uci.edu/summary.task.type.html
http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-20/www/data/
http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/
http://www.phys.uni.torun.pl/~duch/software.html
在下面的网址可以找到reuters数据集http://www.research.att.com/~lewis/reuters21578.html

以下网址上有各种数据集:
http://kdd.ics.uci.edu/summary.data.type.html

进行文本分类,还有一个数据集是可以用的,即rainbow的数据集
http://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html

3、找了很多测试数据集,写论文的同志们肯定需要的,至少能用来检验算法的效果
可能有一些不能访问,但是总有能访问的吧:

UCI收集的机器学习数据集
ftp://pami.sjtu.edu.cn/
http://www.ics.uci.edu/~mlearn//MLRepository.htm

statlib 
http://liama.ia.ac.cn/SCILAB/scilabindexgb.htm
http://lib.stat.cmu.edu/

样本数据库
http://kdd.ics.uci.edu/
http://www.ics.uci.edu/~mlearn/MLRepository.html

关于基金的数据挖掘的网站
http://www.gotofund.com/index.asp

http://lans.ece.utexas.edu/~strehl/

reuters数据集
http://www.research.att.com/~lewis/reuters21578.html

各种数据集:
http://kdd.ics.uci.edu/summary.data.type.html
http://www.mlnet.org/cgi-bin/mlnetois.pl/?File=datasets.html
http://lib.stat.cmu.edu/datasets/
http://dctc.sjtu.edu.cn/adaptive/datasets/ 
http://fimi.cs.helsinki.fi/data/
http://www.almaden.ibm.com/software/quest/Resources/index.shtml
http://miles.cnuce.cnr.it/~palmeri/datam/DCI/

进行文本分类&WEB
http://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html

http://www.w3.org/TR/WD-logfile-960221.html
http://www.w3.org/Daemon/User/Config/Logging.html#AccessLog
http://www.w3.org/1998/11/05/WC-workshop/Papers/bala2.html
http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/
http://www.web-caching.com/traces-logs.html
http://www-2.cs.cmu.edu/webkb
http://www.cs.auc.dk/research/DP/tdb/TimeCenter/TimeCenterPublications/TR-75.pdf
http://www.cs.cornell.edu/projects/kddcup/index.html

时间序列数据的网址
http://www.stat.wisc.edu/~reinsel/bjr-data/

apriori算法的测试数据
http://www.almaden.ibm.com/cs/quest/syndata.html

数据生成器的链接
http://www.cse.cuhk.edu.hk/~kdd/data_collection.html
http://www.almaden.ibm.com/cs/quest/syndata.html

关联:
http://flow.dl.sourceforge.net/sourceforge/weka/regression-datasets.jar
http://www.almaden.ibm.com/software/quest/Resources/datasets/syndata.html#assocSynData

WEKA:
http://flow.dl.sourceforge.net/sourceforge/weka/regression-datasets.jar
1。A jarfile containing 37 classification problems, originally obtained from the UCI repository
http://prdownloads.sourceforge.net/weka/datasets-UCI.jar
2。A jarfile containing 37 regression problems, obtained from various sources
http://prdownloads.sourceforge.net/weka/datasets-numeric.jar
3。A jarfile containing 30 regression datasets collected by Luis Torgo
http://prdownloads.sourceforge.net/weka/regression-datasets.jar

癌症基因:
http://www.broad.mit.edu/cgi-bin/cancer/datasets.cgi

金融数据:
http://lisp.vse.cz/pkdd99/Challenge/chall.htm

另一个人提供的
http://www.cs.toronto.edu/~roweis/data.html
http://kdd.ics.uci.edu/summary.task.type.html
http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-20/www/data/
http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/
http://www.phys.uni.torun.pl/~duch/software.html
在下面的网址可以找到reuters数据集
http://www.research.att.com/~lewis/reuters21578.html

以下网址上有各种数据集:
http://kdd.ics.uci.edu/summary.data.type.html

进行文本分类,还有一个数据集是可以用的,即rainbow的数据集
http://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html

Download the Financial Data (~17.5M zipped file, ~67M unzipped data) 
Download the Medical Data (~2M zipped file, ~6M unzipped data)
http://lisp.vse.cz/pkdd99/Challenge/chall.htm

kdnuggets 相关链接数据集:
http://www.kdnuggets.com/datasets/index.html

还有另外一个很好的资源网址为:http://kdd.ics.uci.edu/,里面包含的数据资源如下(按应用领域划分):

Direct Marketing 
  KDD CUP 1998 Data

GIS 
  Forest CoverType

Indexing 
  Corel Image Features 
  Pseudo Periodic Synthetic Time Series

Intrusion Detection 
  KDD CUP 1999 Data

Process Control 
  Synthetic Control Chart Time Series

Recommendation Systems 
  Entree Chicago Recommendation Data

Robots 
  Pioneer-1 Mobile Robot Data 
  Robot Execution Failures

Sign Language Recognition 
  Australian Sign Language Data 
  High-quality Australian Sign Language Data

Text Categorization 
  20 Newsgroups Data 
  Reuters-21578 Text Categorization Collection 
  NSF Research Awards Abstracts 199 0-2003

World Wide Web 
  Microsoft Anonymous Web Data 
  MSNBC Anonymous Web Data 
  Syskill Webert Web Data

这里又找到一个,在一个老外的blog上找到的。(儿童节前一天)
http://www.fs.fed.us/fire/fuelman/

数据挖掘的数据集资源相关推荐

  1. 转:UCI数据集和源代码数据挖掘的数据集资源

    <UCI数据集和源代码> UCI数据集是一个常用的标准测试数据集,下载地址在 http://www.ics.uci.edu/~mlearn/MLRepository.html 我的主页上也 ...

  2. UCI数据集和源代码数据挖掘的数据集资源

    <UCI数据集和源代码> UCI数据集是一个常用的标准测试数据集,下载地址在 http://www.ics.uci.edu/~mlearn/MLRepository.html 我的主页上也 ...

  3. 人工智能大数据,公开的海量数据集下载,ImageNet数据集下载,数据挖掘机器学习数据集下载...

    人工智能大数据,公开的海量数据集下载,ImageNet数据集下载,数据挖掘机器学习数据集下载 ImageNet挑战赛中超越人类的计算机视觉系统 微软亚洲研究院视觉计算组基于深度卷积神经网络(CNN)的 ...

  4. 人工智能大数据,公开的海量数据集下载,ImageNet数据集下载,数据挖掘机器学习数据集下载

    人工智能大数据,公开的海量数据集下载,ImageNet数据集下载,数据挖掘机器学习数据集下载 ImageNet挑战赛中超越人类的计算机视觉系统 微软亚洲研究院视觉计算组基于深度卷积神经网络(CNN)的 ...

  5. 8种寻找机器学习数据集的方法 | 附数据集资源

    乾明 发自 凹非寺 量子位 出品 | 公众号 QbitAI 在训练机器学习模型时,找到合适的数据集一直是个棘手的问题. 近日,亚马逊AWS高级技术顾问Will Badr介绍了8种寻找机器学习数据集的方 ...

  6. 深度学习中常见的打标签工具和数据集资源

    深度学习中常见的打标签工具和数据集资源 一.打标签工具 1. labelimg/labelme 1.1 搭建图片标注环境(win10) (1) 安装anaconda3 (2) 在anaconda环境p ...

  7. 大数据挖掘课程案例资源介绍

    大数据挖掘课程案例资源分为[基础]版,[进阶]版,不同阶段的课程难易程度不一样,对学生的基础知识掌握要求也不一样.               [基础]Python编程基础         通过学习本 ...

  8. 多目标跟踪(MOT)数据集资源整理分享

    我们已经生活在一个被摄像头和视频包围的世界里,从手机.汽车.无人机到各类监控设备,随处可见摄像头的"身影".据前瞻产业研究院2020年的报告分析,预计到2025年全球摄像头镜头的出 ...

  9. AI深度、机器学习数据集资源汇总

    文章目录 前言 一.数据集网站 二.具体数据集 1.记录的具体数据集 2.医疗图像 3.网上数据集汇总链接 总结 前言 继续收集.更新.汇总....................... 一.数据集网 ...

最新文章

  1. 【OCP新题库】052最新题库解析-第5题
  2. python交互式程序设计导论第二周_沧州学堂云Python 交互式程序设计导论搜题公众号...
  3. [armv8-arch64]linux kernel 5.9的异常量表介绍(irq,fiq,sync,svc)
  4. Vim安装、配置和插件的添加使用(可以以目录的形式打开)
  5. 为爱追寻_从机械师到编码员:追寻梦想如何改变了我的生活
  6. linux mysql 安装innodb_在ubuntu Mysql 5.7 安装InnoDB Memcached 插件
  7. 数据结构之树的定义及操作
  8. 不玩了?王思聪退出香蕉娱乐董事长职务,麻闻多接任
  9. C++ double转CStringW/LPCWSTR
  10. tree.js 制作酷炫照片墙
  11. Dirt Ratio HDU - 6070
  12. docker用现有容器创建镜像
  13. JDF的实质与走向(转)
  14. 手机淘宝——flexible.js 移动端自适应方案
  15. 《计算机学报》征稿简则
  16. 打印幻灯片去掉空白边缘
  17. tensorflow中对lstm及双向lstm的理解
  18. Github常用英文翻译
  19. Android开发艺术探索--第二章IPC机制(2)之Binder
  20. 脖子为什么越按越疼?

热门文章

  1. Windows11升级绕过不支持该处理器
  2. C语言之指针本身地址与指针向的地址(四十四)
  3. cscope索引软链接解决方法
  4. 集成Android免费语音合成功能(在线、离线、离在线融合),有这一篇文章就够了(离线)
  5. 蓝牙avrcp协议源码分析
  6. 人人都应该学习并成为优秀的产品经理,因为你要为《你自己》这个产品负责到底
  7. 深度学习自学(三十二):半监督焦点人物检测
  8. hrrn算法java_常用的调度算法
  9. windows查看器无法打开图片_Win7自带图片查看器异常
  10. 威纶通宏开机后使用初始化宏指令_你按下电脑开机键后,电脑都干了些什么?...