开源数据 Open/Free Data Sources/Datasets
最近需要为数据整合准备一些数据源,调研下来可知如今的Open Data Sources可谓五花八门,举不胜数。现将近期整理收集的Open Data Sources罗列如下:
- Chefmoz http://www.dmoz.org/cm_index.html 餐饮评论
- ChemSpider http://www.chemspider.com/ 化学数据
- CNET http://www.cnetnews.com.cn/
- CKAN (Comprehensive Knowledge Achieve Network) http://datahub.io/ 典型的开放数据集包括:全球人口密度数据库、30年的美国专利等
- Data360 http://www.data360.org/
- data.gov.be http://data.gov.be/
- data.dov www.data.gov 政府数据
- Data Marke thttp://datamarket.com/ Data Maket提供的数据集涉及领域主要包括: 经济、健康、食物和农业、汽车工业。
- DataPlace http://www.dataplace.org/
- Data Wrangling http://www.datawrangling.com/
- DBPedia http://dbpedia.org/Datasets 从Wikipedia中抽取出来的数据,并对数据建立关联,发布成Linked Data。目前英文版本的数据集描述了3,770,000‘thing’, 400,000,000 'facts'
- Facebook https://developers.facebook.com/docs/reference/api/ 社交数据
- Freebase http://www.freebase.com/
- Flickr Wrappr http://wifo5-03.informatik.uni-mannheim.de/flickrwrappr/
- Geonames http://www.geonames.org/ 地理位置信息
- IMDb Datahttp://www.imdb.com/
- Infochimps http://www.infochimps.com/datasets 目前包括11446个数据集
- JigSaw http://www.jigsaw.com/
- MusicBrainz http://musicbrainz.org/
- Numbrary http://numbrary.com
- OpenCyc.org http://www.opencyc.org
- Opendata movement http://visual.ly/open-data-movement
- OpenData by Socrata https://opendata.socrata.com/
- OpenGuilds
- Open Linked Data http://linkeddata.org/
- open.mflask.com
- OpenStreetMap http://www.openstreetmap.org/
- OpenTick http://www.opentick.com/
- Quandl.com http://www.quandl.com
- Reuters Corpus http://about.reuters.com/researchandstandards/corpus/
- Seeking Alpha http://seekingalpha.com/
- servir.net
- SmartHippo http://www.smarthippo.com/
- StYliD (Stucture Your Owl Linker Data)
- swivel.com
- SWSE (Semantic Web Search Engine)http://swse.org/
- Theinfo.org http://theinfo.org/
- TingISBN http://www.librarything.com/blogs/thingology/category/thingisbn/
- UNData http://data.un.org/
- Weather Undergroundhttp://www.wunderground.com/http://www.wunderground.com/ 天气信息
- WeatherBase http://www.weatherbase.com/ 29,252个城市的天气数据信息。
- Fama-French Data Library http://mba.tuck.dartmouth.edu/pages/faculty/ken.french/data_library.html
- Federal Reserve Economic Data (FRWD) http://research.stlouisfed.org/fred2/
- Google Finance https://www.google.com/finance
- Robert Shiller PE10 Data http://www.econ.yale.edu/~shiller/data.htm
- Statistical Abstract of the United States http://www.census.gov/compendia/statab/
- Treasury Yield Curve Rates http://www.treasury.gov/resource-center/data-chart-center/Pages/index.aspx
- Yahoo! Finance http://finance.yahoo.com/
1. http://ideasource.blankdots.com/2012/08/open-data-sources/
开源数据 Open/Free Data Sources/Datasets相关推荐
- 要闻君说:亚马逊也进击开源了吗?微软收购开源软件公司Citus Data,剑指云服务!投资15亿的数据中心忠德粤桂云来了!...
关注并标星星CSDN云计算 每周三次,打卡即read 更快.更全了解泛云圈精彩news go go go 嗨,大家好!偶是要闻君.工作日的最后一周,有没有很兴奋?边学习边听歌吧! 文/要闻君 近日, ...
- 电机轴承故障相关的开源数据(不断更新中)
电机轴承故障相关的开源数据 参考链接出处:电机轴承故障相关的开源数据 1.西储大学轴承数据 使用较多,数据链接: 西储大学数据链接 在python中自动下载的技术 2.美国-机械故障预防技术学会MFP ...
- 第四范式陈雨强:万字深析工业界机器学习最新黑科技 By 机器之心2017年7月25日 16:38 近日,全球最顶级大数据会议 Strata Data Conference 在京召开。Strata 大
第四范式陈雨强:万字深析工业界机器学习最新黑科技 By 机器之心2017年7月25日 16:38 近日,全球最顶级大数据会议 Strata Data Conference 在京召开.Strata 大会 ...
- TensorFlow tf.data 导入数据(tf.data官方教程) * * * * *
原文链接:https://blog.csdn.net/u014061630/article/details/80728694 TensorFlow版本:1.10.0 > Guide > I ...
- 1.11.Flink DataSetAPI、DataSet API之Data Sources、DataSet API之Transformations、DataSet Sink部分详解
1.11.Flink DataSetAPI 1.11.1.DataSet API之Data Sources 1.11.2.DataSet API之Transformations 1.11.3.Data ...
- 1.10.Flink DataStreamAPI(API的抽象级别、Data Sources、connectors、Source容错性保证、Sink容错性保证、自定义sink、partition等)
1.10.Flink DataStreamAPI 1.10.1.Flink API的抽象级别 1.10.2.DatSource部分详解 1.10.2.1.DataStream API之Data Sou ...
- 知乎 开源机器学习_使用开源数据和机器学习预测海洋温度
知乎 开源机器学习 In this tutorial, we're going to show you how to take open source data from the National O ...
- 徒手打造基于Spark的数据工厂(Data Factory):从设计到实现
在大数据处理和人工智能时代,数据工厂(Data Factory)无疑是一个非常重要的大数据处理平台.市面上也有成熟的相关产品,比如Azure Data Factory,不仅功能强大,而且依托微软的云计 ...
- 开源 数据查询 工具_6个用于数据新闻的开源工具
开源 数据查询 工具 当我1980年代末期在新闻学院上学时,收集一个故事的数据通常需要花大量时间浏览打印的文档或缩微胶片. 从那以后很多事情改变了. 尽管印刷资源仍然有用,但越来越多的信息可供网络记者 ...
最新文章
- 收藏 | 卷积神经网络 C++ 从零开始实现
- python isinstance type区别
- SaaS颠覆传统软件到底是不是个伪命题?
- caffe框架下目标检测——faster-rcnn实战篇问题集锦
- IDEA中配置Maven环境
- python创建文本、判断该文件共有多少行_python如何判断文件有多少行
- api 二次 开发 禅道_二次开发
- linux mtime参数,linux find mtime参数详解
- java arraylist add时默认调用tostring_java中如何调用toString命名的方法?
- 想要实现自动驾驶?高精度地图不可或缺
- differential forms
- 第27课 数组的本质分析
- DUMP-CX_SY_OPEN_SQL_DB-DBSQL_DUPLICATE_KEY_ERROR
- hashmap怎么保证线程安全的方式
- 计算机网络 理解拥塞控制
- 用正则表达式抓取网页图片
- Vue组件化开发--脚手架的安装使用、目录结构说明
- FLASH抽象层(FAL)程序的应用(rt-thread)
- 全球即将诞生第二家卡车自动驾驶上市公司,行业转折点已经到来
- 微信开发:springboot接入微信公众号
热门文章
- 看了Python在金融行业中的应用,大数据分析实在太重要了
- [UE4] 使用 GUI 框架“Dear ImGui” 示例:ImguiLogWindow
- Simotion应用与组网之十三之BG编程
- Corel MyDVD Pro for Mac(专业DVD制作软件)
- 物理拷贝备份mysql到其他机器上恢复
- 多元线性回归模型中的常数项
- 变频器转矩计算机构负载,变频器如何与平方转矩负载匹配?
- 在登录的状态下获取登录的个人信息
- Linux下的段错误分析
- 得知女儿被猥亵,35岁男子将对方打至轻伤二级,法院作出不起诉决定