简介

对于统计专业的学生/学者,除了对统计理论/方法的学习之外,我们也应该有产生和获取数据的能力。而不能闭门造车,仅仅做一些理论的内容。小编认为更应该从实际出发(数据出发),观察数据中存在的问题,进而使用一些统计理论解决问题。

上面的话主要从统计大咖们的讲座中受到启发。于是,我也开始以这种思维进行科研和学习。

下面分享一些,自己“存”的数据以及可以获得数据的开源网站。

GitHub——Awesome Public Datasets

该仓库收藏量高达 51k,可想而知它的影响力有多大了吧。内部包含各个领域的开源数据。目录可见下面照片:

小编暂时还没有探索这么多的数据集。有兴趣的读者可以自行探索~

Kaggle——datasets

Kaggle 中给了很多开源的数据集,并且有很多数据集都被人探索过,也会分析一些分析代码。读者可以根据大佬们的代码,逐步实现/学习。

类似的数据竞赛网站还包括:DataCastle、天池、Datafountain等。

UCI——数据仓库

该网站目前维护了 622 个经典的机器学习、数据挖掘数据集,包含分类、聚类、回归等问题下的多个数据集(截止今天)。

博客——数据科学的100个开源数据集

这篇博客给出了数据科学开源的 100 个数据集,感兴趣也可以看看。

NASA——Open Data

小编的研究方向偏工业工程,这里推荐下 NASA 的网站,里面包含了很多工业数据集。很多研究都是基于这些数据集进行的。

小编有话说

这里小编只是简单罗列了下,可以获取数据的一些网站。当然你也可以通过其他方式获得数据,例如:国家数据、世界银行公开数据、中国统计信息网、国家统计局、世界银行、WTO、美国政府开放数据等。

知乎上也有类似问题与回答,可供参考。

当然不同领域可能会有自己的数据库/网站等。如果读者愿意分享出来,欢迎文末留言,让信息开源,共享给更多人吧~

大家都是在哪些网站找数据?相关推荐

  1. 要分析数据,可以先去这些数据网站找数据

    作者:帆软 来源:知乎 金融财经数据 同花顺数据中心:提供股票债券等金融数据 和讯数据:提供各种股票.基金.外汇.债券等实时数据,有付费,有免费 零壹财经:大大小小的网贷数据.排行榜等 金融数据网:提 ...

  2. 不知道从哪里找数据?这一篇,都解决(持续更新)

    不知道从哪里找数据?这一篇,都搞定!(持续更新) 相信很多小伙伴在做数据分析或者可视化的时候,经常会遇到--方法工具都有了,但是数据,数据,数据没有啊! 好不容易找到了看起来还不错的网站,再一看,年费 ...

  3. Python Socket请求网站获取数据

     Python Socket请求网站获取数据 ---阻塞 I/O     ->收快递,快递如果不到,就干不了其他的活 ---非阻塞I/0 ->收快递,不断的去问,有没有送到,有没有送到,. ...

  4. php如何查找业务bug,一般从php网站找bug怎么开始

    上司让给网站找出十个bug,完全没有头绪- – 回复讨论(解决方案) 测试啊,运行后各种找咯.. 断链.错链 对错误的 url 的处理 对错误的用户交互数据的处理 断链.错链 对错误的 url 的处理 ...

  5. python爬虫代码-学Python=写爬虫?不用代码也能爬下95%网站的数据!

    你好,这里是BIMBOX,我是老孙. 前些天BOX群里一位小伙伴问我们,现在市面上有一千多块钱的Python网络课程,两个月学完,能入门网络爬虫,大部分网站的数据都可以爬下来,这个学费值不值得? 我们 ...

  6. Node.js 使用http客户端向网站请求数据并保存

    app.js代码: // 内置http模块,提供了http服务器和客户端功能 var http=require("http");// 内置文件处理模块 var fs=require ...

  7. 网站优化数据关键词统计分析优化技巧

    网站优化有哪些基本技巧是我们需要掌握的,除了基本的SEO理念网站数据统计和分析也是比较重要的环节,通过对我没网站各项数据的汇总分析,我们可以及时对网站的运行情况,流量数据和关键词效果等有一个直观的感受 ...

  8. 数据网站 免费数据网站

    由于职业原因,老李经常需要各个行业的数据,这么多年过去了也搜集了不少.今天就给大家分享一下我的宝藏免费数据网站们. 一.国家社会类 1.中国统计局 链接:http://data.stats.gov.c ...

  9. java 开发用到网络爬虫,抓取汽车之家网站全部数据经历

    经历了两个礼拜的折腾,某某知名网站的数据终于到手了.犯罪没被发现这种心情感觉很爽. 说一下我的犯罪经历,之前公司总是抓取某某网站数据,可能是被发现了.某某网站改变了策略.通过各种技术终止了我们的行为, ...

最新文章

  1. 2018-12-04-Python全栈开发-day92-自动登录
  2. MySQL 快速入门教程
  3. localdate计算相差天数_干掉 Date,LocalDate 真香!
  4. Ubuntu16.04安装QQ机器人
  5. realme下月将推Q3s:Q系列下半年独苗 配置更强更全面
  6. Qt安卓开发环境搭建
  7. 原生js实现删除节点操作
  8. CentOS配置国内(阿里云)镜像加速器
  9. rmmod命令卸载驱动过程详解
  10. 计算机登录密码保存,怎么查看电脑浏览器中保存的密码
  11. ajax接收反参时,接收到[object XMLDocument]时的处理方法
  12. 全景视频/VR的全流程处理解析-文献资料整理归纳
  13. QXlsx(访问Excel)
  14. 如何把多张图片合并成一个PDF?
  15. 微信小程序,画布中,根据需要展示的图片比例,获取能截取原图中的最大图片尺寸,并且不变形展示
  16. 8321平台修改WIFI_ONLY总结
  17. 伯克利摘得最佳论文,陈丹琦、杨笛一等华人团队获杰出论文,ACL2022奖项公布...
  18. java 二义性_Java接口默认方法带来的问题分析【二义性问题】
  19. java毕业设计_基于web的游泳馆管理系统的设计与实现
  20. LaTex 插入图片技巧

热门文章

  1. 微信小程序--云开发数据库操作之where()
  2. Qt 应用程序输出中文乱码+UI界面输出中文乱码
  3. Delphi导出word
  4. python面试常问
  5. Vultr开启宝塔8888端口教程,手把手教你开启8888端口以及其它端口
  6. html文字显示为单行,双行
  7. 行人重识别通用数据集及介绍
  8. 读书笔记:《不抱怨的世界》
  9. CSAW CTF 2016 PWN quals-warmup
  10. IP-GUARD加密文件无法打开或者打开时显示乱码