强烈推荐!大数据领域的顶级开源工具大集合
如今,从小型初创企业到行业巨头,各种规模的供应商都在使用开源来处理大数据和运行预测分析。借助开源与云计算技术,新兴公司甚至在很多方面都可以与大厂商抗衡。
以下是一些大数据方面的顶级开源工具,分为四个领域:数据存储、开发平台、开发工具和集成、分析和报告工具。
数据存储:
Apache Hadoop– Cloud Foundry(VMware), Hortonworks, Hadapt
NoSql 数据库 – MongoDB, Cassandra, Hbase
SQL 数据库 – MySql(Oracle), MariaDB, PostgreSQL, TokuDB
开发平台:
Apache Hadoop平台 – Impala(开源大数据分析引擎); Lingual(ANSI SQL); Pattern(analytics); Cascading(开源大数据应用程序开发框架)
Apache Lucene和 Solr平台
OpenStack(构建私有云和公有云)
Red Hat (搭载 Hadoop 服务器的标准 Linux 发行版)
REEF(微软的Hadoop开发者平台)
Storm(集成了各种排队系统和数据库系统)
开发工具和集成:
Apache Mahout(机器学习的编程语言)
Python 和 R(预测分析编程语言)
分析和报告工具:
Jaspersoft(报告和分析服务器)
Pentaho(数据集成和业务分析)
Splunk(IT分析平台)
Talend(大数据集成,数据管理和应用集成)
以上就是我们总结的大数据方面不错的工具,希望对您有所帮助。
英文原文: blackducksoftware
From:http://www.admin10000.com/document/4240.html
转载于:https://blog.51cto.com/dwf07223/1396140
强烈推荐!大数据领域的顶级开源工具大集合相关推荐
- 工业大数据漫谈9:开源工业大数据软件简介(上)
今天真是一个美好的时代,有无数的开源系统可以为我们提供服务,现在有许多开发软件可以用到工业大数据中,当然很多系统还不成熟,应用到工业中还需要小心,并且需要开发人员对其进行一定的优化和调整.下面就简单介 ...
- 大数据可视化html模板开源_大数据时代-可视化数据分析平台必不可少
公众号:不安分的猿人 一.项目简介 DataGear是一款数据管理与可视化分析平台,使用Java语言开发,采用浏览器/服务器架构,支持多种数据库, 主要功能包括数据管理.SQL工作台.数据导入/导出. ...
- FFA 议程上线!实时化浪潮下,Apache Flink 还将在大数据领域掀起怎样的变革?...
Flink Forward Asia 2022 将于 11 月 26-27 日在线上举办,议程内容正式上线! 今年是 Flink Forward Asia(下文简称 FFA)落地中国的第五个年头,也是 ...
- 实时化浪潮下,Apache Flink还将在大数据领域掀起怎样的变革?
Flink Forward Asia 2022 将于 11 月 26-27 日在线上举办,议程内容正式上线! 今年是 Flink Forward Asia(下文简称 FFA)落地中国的第五个年头,也是 ...
- 聚焦云计算、大数据、人工智能等开源技术,这场开源开发者的盛会不容错过!
作为业界具有广泛影响力的开源年度盛会,2022 第七届中国开源年会 (COSCon'22) 将于 10 月 29 日 - 30 日在线上(元宇宙+传统线上直播渠道)& 线下(10+ 线下分会场 ...
- 大数据在线分析处理和常用工具
大数据在线分析处理的特点 . 数据源源不断的到来: 数据需要尽快的得到处理,不能产生积压: 处理之后的数据量依然巨大,仍然后TB级甚至PB级的数据量: 处理的结果能够尽快的展现: 以上四个特点可以总结 ...
- 大数据基石-Hadoop3.x学习教程-大数据场景介绍
大数据基石-Hadoop Hadoop3.x版本全系列教程 === 楼兰 === 文章目录 一.理解大数据 1.大数据的特点 2.大数据的应用方向 3.大数据的工作前景 二.大数据课程体系介绍 1.大 ...
- 荐六十款针对Hadoop和大数据顶级开源工具
为什么80%的码农都做不了架构师?>>> 荐六十款针对Hadoop和大数据顶级开源工具 2015-08-10 10:37 布加迪编译 51CTO 字号: T | T 说到处理 ...
- “鲜点”资讯:开源平台Apache Beam正式发布,2016大数据领域大事记全回顾
"鲜点"资讯网罗新鲜要闻,每日为你呈现大数据和云计算领域热点新闻.本次内容播报如下: Uber 推出数据平台"Uber Movement",用实时数据帮政府治理 ...
- 开源的Blink和Spark3.0,谁将称霸大数据领域?
来源 | 大数据技术与架构(import_bigdata) 作者 | 王知无,阿里巴巴高级大数据开发工程师,先后在京东.阿里等大型互联网公司从事大数据平台.实时计算和离线计算中间件和业务平台开发. 2 ...
最新文章
- Visual Studio 2008 Express版本下载
- 资料分享 | 数学建模竞赛备战大全
- 大数据电商数仓--记录各种奇奇怪怪的issue
- Python 路径问题--No such file or directory
- oracle open 101,解决oracle数据库ORA-65101 container database set up incorrectly
- 开源流媒体服务器:为何一定得再撸个新的 | 凌云时刻
- 总会用到的系列4:关键时刻能救家庭的保险
- 室外宽温1口千兆光纤收发器工业导轨式发送机接收机单模单纤单电口
- 盗贼之海服务器维护时间,盗贼之海常见问题解决方法
- 怎么修改teredo服务器,技术员设置win7系统通过teredo连接IPv6的修复方案
- 【ZFNet】Visualizing and Understanding Convolutional Networks (2013) 全文翻译
- 北理工python程序设计学习笔记——(三)turtle八边形绘制
- 更换SSD系统盘-PE重装系统
- 基于FPGA的数字钟设计实验报告
- 王学岗Kotlin协程(三)---协程的上下文与协程的异常处理
- python记录鼠标键盘操作自动执行重复工作
- SSD的三组成部件简介:主控芯片 闪存芯片 固件算法
- 美团2021校招笔试-编程题-第10场
- 全网最全的Java Socket通讯例子
- Echarts3实例 加载地图