数据挖掘实验数据集参考,从网上搜集汇总而来,感谢所有贡献的作者。

常用的基本上UCI和w3c的。关于源代码,网上有很多公开源码的算法包,例如最为著名的Weka,MLC++等。Weka还在不断的更新其算法,下载地址:
http://www.cs.waikato.ac.nz/ml/weka/

UCI收集的机器学习数据集
ftp://pami.sjtu.edu.cn

http://www.ics.uci.edu/~mlearn/\MLRepository.htm

聚类【自己加了一个】

http://cs.joensuu.fi/sipu/datasets/

statlib
http://liama.ia.ac.cn/SCILAB/scilabindexgb.htm
http://lib.stat.cmu.edu/

样本数据库
http://kdd.ics.uci.edu/
http://www.ics.uci.edu/~mlearn/MLRepository.html

关于基金的数据挖掘的网站
http://www.gotofund.com/index.asp

http://lans.ece.utexas.edu/~strehl/

reuters 数据集
http://www.research.att.com/~lewis/reuters21578.html

各种数据集:
http://kdd.ics.uci.edu/summary.data.type.html
http://www.mlnet.org/cgi-bin/mlnetois.pl/?File=datasets.html
http://lib.stat.cmu.edu/datasets/
http://dctc.sjtu.edu.cn/adaptive/datasets/
http://fimi.cs.helsinki.fi/data/
http://www.almaden.ibm.com/software/quest/Resources/index.shtml
http://miles.cnuce.cnr.it/~palmeri/datam/DCI/

进行文本分类 &WEB
http://www-2.cs.cmu.edu/afs/cs/p ... ww/naive-bayes.html

http://www.w3.org/TR/WD-logfile-960221.html
http://www.w3.org/Daemon/User/Config/Logging.html#AccessLog
http://www.w3.org/1998/11/05/WC-workshop/Papers/bala2.html
http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/
http://www.web-caching.com/traces-logs.html
http://www-2.cs.cmu.edu/webkb
http://www.cs.auc.dk/research/DP ... lications/TR-75.pdf
http://www.cs.cornell.edu/projects/kddcup/index.html

时间序列数据的网址
http://www.stat.wisc.edu/~reinsel/bjr-data/

apriori 算法的测试数据
http://www.almaden.ibm.com/cs/quest/syndata.html

数据生成器的链接
http://www.cse.cuhk.edu.hk/~kdd/data_collection.html
http://www.almaden.ibm.com/cs/quest/syndata.html

关联:
http://flow.dl.sourceforge.net/s ... ession-datasets.jar
http://www.almaden.ibm.com/softw ... a.html#assocSynData

WEKA :
http://flow.dl.sourceforge.net/s ... ession-datasets.jar
1 。 A jarfile containing 37 classification problems,originally obtained from the UCI repository
http://prdownloads.sourceforge.net/weka/datasets-UCI.jar
2 。 A jarfile containing 37 regression problems,obtained from various sources
http://prdownloads.sourceforge.net/weka/datasets-numeric.jar
3 。 A jarfile containing 30 regression datasetscollected by Luis Torgo
http://prdownloads.sourceforge.net/weka/regression-datasets.jar

癌症基因:
http://www.broad.mit.edu/cgi-bin/cancer/datasets.cgi

金融数据:
http://lisp.vse.cz/pkdd99/Challenge/chall.htm

kdnuggets 相关链接数据集(借花献佛了):
http://www.kdnuggets.com/datasets/index.html

http://www.cs.toronto.edu/~roweis/data.html
http://kdd.ics.uci.edu/summary.task.type.html
http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-20/www/data/
http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/
http://www.phys.uni.torun.pl/~duch/software.html
在下面的网址可以找到 reuters 数据集
http://www.research.att.com/~lewis/reuters21578.html

以下网址上有各种数据集:
http://kdd.ics.uci.edu/summary.data.type.html

进行文本分类,还有一个数据集是可以用的,即 rainbow 的数据集
http://www-2.cs.cmu.edu/afs/cs/p ... ww/naive-bayes.html

数据挖掘中免费数据集下载网站相关推荐

  1. 免费PDF下载网站 Free Pdf Download Engine

    免费PDF下载网站,分享给大家 http://findebookee.com/ http://bulkpdf.com/

  2. 免费电子书下载网站,不来白嫖一波

    作为开发者,多多少少都会看些技术书籍,许多经典的技术书籍作者都是国外的,等到中文翻译版出来很多书籍可能已经不适用了,购买原版书籍,价格又太高,因此知道一些免费的图书下载网站是非常重要的,下面就和大家分 ...

  3. 程序员必备免费电子书下载网站

    程序员必备免费电子书下载网站 作为开发者,多多少少都会看些技术书籍,许多经典的技术书籍作者都是国外的,等到中文翻译版出来很多书籍可能已经不适用了,购买原版书籍,价格又太高,因此知道一些免费的图书下载网 ...

  4. 免费影像数据下载网站汇总——2010年7月28[转自ESRI中国]

    免费影像数据下载网站汇总--2010年7月28[转自ESRI中国] 学习资料 2010-07-28 21:28:49 阅读61 评论0    字号:大中小 订阅 转载:http://hutangao. ...

  5. Dataset:机器学习中常用数据集下载链接集合之详细攻略

    Dataset:机器学习中常用数据集下载链接集合之详细攻略 目录 机器学习中常用数据集下载链接集合之详细攻略 sklearn.datasets数据集所有csv文件集合 seaborn-data数据集所 ...

  6. 46个海量免费电子书下载网站

    平日里比较酷爱看电子书,总是想找点书籍看看,才踏实! 今天比较幸运的在梦想天空的博客里看到一篇"分享45个海量免费电子书下载网站"文章,觉得里面推荐的网站不错,所以在此推荐给喜欢看 ...

  7. 分享45个海量免费电子书下载网站

    随着网络和信息技术的快速发展,电子书越来越流行.以Amazon Kindle为代表的电子书阅读器的出现改变了人们传统的阅读方式,如同iPod改变人们听音乐一样.如今,很多网上书店也推出了电子书商品,相 ...

  8. 10个最好的免费图标下载网站推荐

    经过长期使用整理了10个最好的免费图标下载网站,这次主要推荐符合国人使用习惯的几个网站: http://www.haotu.net/  http://www.iconarchive.com/  htt ...

  9. 免费数据集下载(持续更新中...)

    https://zhuanlan.zhihu.com/p/25138563 分门别类整理了一些网上的免费数据集,这是分类下载地址,希望能节约大家找数据的时间.欢迎数据达人加入QQ群 565136792 ...

最新文章

  1. 解读4G发牌事件,了解下4G那点事!
  2. make编译工具使用
  3. Ajax的用法之JQuery
  4. vivo X21低调奢华 彭于晏携手黑金版来袭
  5. 如何让apache支持.htaccess 解决Internal Server Error The server …错误
  6. 前端学习(561):解决margin重叠第二种情况父子
  7. 有意思的BAT CMD if while循环 整型自增
  8. 【转载保存】cookie在登录时的使用
  9. android wine教程_技术|如何在 Android 上借助 Wine 来运行 Windows Apps
  10. ASP.net C# EVal关于前端绑定
  11. linux 误删文件夹恢复工具,恢复Linux误删除文件系列之foremost工具
  12. java armeabi_armeabi和armeabi-v7a 解释
  13. Autodesk Maya 2009标准培训教材
  14. python cms应用生成_Django:之ORM、CMS和二维码生成
  15. 计算机学院公众号头像制作,公众号头像需要原创吗?公众号头像怎么制作?
  16. android 发送短信的两种方式
  17. iOS 字体集(图文并茂)
  18. 用核显能跑matlab吗,5张图告诉你核显究竟能干嘛
  19. ENVI系列--使用矢量文件裁剪目标区域
  20. lemming games 3 ! hdlbits

热门文章

  1. vue自定义校验规则-联系方式校验(手机或固话)
  2. MYSQL存储过程进行写读操作(for循环)
  3. python运算符_Python运算符的作用与意义
  4. rgb pcm 转 mp4
  5. linux查看防火墙端口并开放指定端口详细教程
  6. geode java_用java连接apache geode
  7. Windows server 2012 FTP服务
  8. mysql数据库如何克隆好友怎么弄_怎样把我的Mysql中的数据库复制到另一台电脑中...
  9. 外汇天眼:一笔赚了12600美元 你羡慕吗?
  10. 概率统计基础(三):常见分布与假设检验