超全必看!开源时间序列数据集整理
前言
数据是驱动科技发展的源泉,平时我们科研中也经常需要在各种开源数据上验证自己模型的效果。那时间序列目前可以使用的开源数据集有哪些呢?本期为大家做一次较为全面的整理汇总。
UCR Time Series
UCR时间序列数据集是时序领域的“Imagnet”,涵盖医疗/电力/地理 等诸多领域,目前全量数据有128种。涉及时间序列预测、回归、聚类等诸多任务,可以说是发Paper必跑数据集,由加州大学河滨分校计算机系的教授 Eamonn Keogh 所在的课题组维护。
http://www.cs.ucr.edu/~eamonn/time_series_data/
FigShare
figShare是一个研究成果共享平台,这里向全世界开放免费的研究成果及科学数据。
https://figshare.com/
Awesome Public Datasets
该项目提供了一个非常全面的数据获取渠道,包含各个细分领域的数据库资源,自然科学和社会科学的覆盖都很全面,适合做研究和数据分析的人员。
https://github.com/awesomedata/awesome-public-datasets
服务监控数据集
该数据集是由人工神经网络公司Numenta所提供的,包含互联网服务场景下的各种流式数据与评测脚本。NAB是用于评估数据流实时应用中异常检测算法的新颖基准,它由50多个带有标签的真实世界和人工时间序列数据文件以及为实时应用程序设计的新颖评分机制组成。
https://github.com/numenta/NAB
音乐数据库
这个数据集包含了海量的公开音乐数据库,适用于包含音乐推荐、分类在内的各种任务
http://millionsongdataset.com/
mir_datas
国家经济数据库
国家统计局经常会统计涉及经济民生等多个方面的指标,提供了非常丰富的开源时间序列数据。这里简单为大家列举一些可以获取这些数据的渠道:
国家数据
数据来源中华人民共和国国家统计局,包含了我国经济民生等多个方面的数据,并且在月度、季度、年度都有覆盖,较为全面。
https://data.stats.gov.cn/
CEIC
涵盖超过195个国家400多万个时间序列的数据源,最完整的一套超过128个国家的经济数据,能够精确查找GDP、CPI、进口、出口、外资直接投资、零售、销售以及国际利率等深度数据。
https://www.ceicdata.com/zh-hans
万得
被誉为中国的Bloomberg,在金融业有着全面的数据覆盖,金融数据的类目更新非常快,据说很受国内的商业分析者和投资人的亲睐。
https://www.wind.com.cn/
中国统计信息网
国家统计局的官方网站,汇集了全国各级政府各年度的国民经济和社会发展统计信息,建立了以统计公报为主,统计年鉴、阶段发展数据、统计分析、经济新闻、主要统计指标排行等。
http://www.tjcn.org/
政府开放数据
除了上述国家经济数据库以外,各地方也有自己的开放数据。这里简单列举:
· 北京市政务数据资源网:包含竞技、交通、医疗、天气等数据。
https://data.beijing.gov.cn/
· 深圳市政府数据开放平台:交通、文娱、就业、基础设施等数据。
https://opendata.sz.gov.cn/
· 上海市政务数据服务网:覆盖经济建设、文化科技、信用服务、交通出行等12个重点领域数据。
https://data.sh.gov.cn/
· 贵州省政府数据开放平台:贵州省在政务数据开放方面做的确实不错。
http://data.guizhou.gov.cn/
· Data.Gov:美国政府开放数据,包含气候、教育、能源金融等各领域数据。
https://www.data.gov/
ts_0.
数据竞赛平台
除了上面整理的常用的开源时间序列数据以外,我们如果想获取针对特定任务的时间序列数据,还可以通过各种竞赛平台获取数据。这些数据集通常干净且科研性非常高。包括:
DataCastle:专业的数据科学竞赛平台
https://js.dclab.run/v2/index.html
Kaggle:全球最大的数据竞赛平台
https://www.kaggle.com/
天池:阿里旗下数据科学竞赛平台
https://tianchi.aliyun.com/
Datafountain:CCF制定大数据竞赛平台
https://www.datafountain.cn/
超全必看!开源时间序列数据集整理相关推荐
- 【超全必看】Redis基础入门学习笔记(附示例代码)
Redis简介 许多网站在海量用户访问的高并发情况下出现崩溃问题,根本原因是关系型数据库. 关系型数据库的缺点 性能瓶颈:磁盘IO性能低下 扩展瓶颈:数据关系复杂,扩展性差,不便于大规模集群 解决思路 ...
- sob攻略超详细攻略_2020云南旅游超详细必看攻略(附带云南美食景点攻略)
原标题:2020云南旅游超详细必看攻略(附带云南美食景点攻略) 云南,很多人首选的旅行目的地,云南的旅游景点多,而且也比较分散,建议大家先做好旅游攻略再出发吧,不然真的去到会很迷茫.也许有很多小伙伴是 ...
- vant 半圆仪表盘_超全的 Vue 开源项目合集,签收一下
原标题:超全的 Vue 开源项目合集,签收一下 写在前面 包括一些ui库和比较完整的小项目.ui库会对主要的单选框,多选框,级联选择器,滑块,日期/时间选择器,进度条,分页,弹框,通知,导航菜单,步骤 ...
- 超全的echarts折线图样式整理
超全的echarts折线图样式整理 本次记录了echarts的折线颜色修改.自定义展示折线最后一个数值内容.自定义折线内容颜色.自定义折线图缩放展示.x轴线条粗细调整.x轴箭头单箭头调整.y轴线条粗细 ...
- 【Keras+计算机视觉+Tensorflow】OCR文字识别实战(附源码和数据集 超详细必看)
需要源码和数据集请点赞关注收藏后评论区留言私信~~~ 一.OCR文字识别简介 利用计算机自动识别字符的技术,是模式识别应用的一个重要领域.人们在生产和生活中,要处理大量的文字.报表和文本.为了减轻人们 ...
- 超全窗c4d模型素材网站整理
窗c4d模型类资源应该算是素材类网站中必不可少的资源类型了吧~今天给大家推荐超好用,免费质量高的素材噢,让你坐拥海量资源同时又不撞款! 在找寻资源的时候,无意中发现了这个网站,资源多,质量好,让我深深 ...
- 超全总结!视觉SLAM方案整理及硬件选型(附项目地址)
编辑丨智东西公开课 本文已获CSDN博主「Mega_Li」授权发布,如需转载请与原作者联系.原文链接:https://blog.csdn.net/lwx309025167/article/detail ...
- concat合并的数组会有顺序么_超全的JS常用数组方法整理
前言 常用数组方法汇总 方法解析 1:concat(); 2:join(); 3:pop(); 4:shift(); 5:unshift(); 7:reverse(); 8:sort(); 9:sli ...
- 超全植物UE4素材素材网站整理
前方注意咯!建议先收藏再看哦!为大家整理植物UE4素材素材,总有满足你需求的一款,除此之外,免费,资源质量好,一键打包下载,你还不心动吗? 在找寻资源的时候,无意中发现了这个网站,资源多,质量好,让我 ...
- 【机器学习】Rasa NLU以及Rasa Core概念和语法简介(超详细必看)
觉得有帮助请点赞关注收藏~~~ 一.Rasa简介 Rasa是一个开源机器学习框架,可以用于构建基于文本和语音的对话驱动型自动化智能客服助手,能够克服传统客服的部分缺陷,在Windows操作系统环境下, ...
最新文章
- SAP MM 向交货单的存在不阻止PO被删除
- ubuntu16.04 npm安装
- Boost:自定义双端队列的测试程序
- C++shell sort希尔排序的实现算法之一(附完整源码)
- linux文本处理常用指令总结
- 【面试题】序列化的 10 几个问题
- php 静态 成员属性,[已解决]php中静态成员方法和静态成员变量是不是不支持多态?...
- 职称英语与计算机考试试题,2020年职称计算机考试模拟选择试题及答案.doc
- 质数的后代c语言,GRE机经:2014数学sub回忆题(造福后人)
- linux init进程源码,Android启动Init进程源码分析
- 新手程序员进阶必学,Python常用模块及用法汇总(内容较干建议收藏)
- 双路CPU笔记本计算机,什么是双路cpu cpu双路什么意思 - 云骑士一键重装系统
- ActiveMQ集群安装与配置
- linux 历史重大更新整理
- HrbustOJ 1167 每种面值的货币要多少
- c语言折半查找平均查找长度,求折半查找成功时的平均查找长度
- Unity学习笔记-通过接入百度语音sdk实现语音唤醒功能
- ansys怎么批量输入点坐标_AUTO CAD批量输入坐标的技巧
- OSG内置的枚举键值与键盘的对应关系
- 诚之和:滴滴禁闭百日司机、用户与暗战
热门文章
- freeradius mysql_centos7 freeradius mysql配置
- 生成登录验证码,点击更换验证码图片
- 阿里实习转正面试收获总结
- 创新检查技术,赋能保密监管 ,您需要一款这样的数据库内容保密检查系统!
- ML Note 3.4 - 数据降维算法 PCA / t-SNE
- 金山毒霸捆绑安装软件被起诉,辩称属于行业惯例
- 看服务器硬盘序列号,获得服务器硬件信息(CPUID、硬盘号、主板序列号、IP地址等)...
- 鲁班H5页面生成工具源码
- 【毕业设计】python+opencv+机器学习车牌识别
- PDF转Word软件