随着大数据与预测分析的成熟,开源作为底层技术授权解决方案的最大贡献者的优势越来越明显。

  如今,从小型初创企业到行业巨头,各种规模的供应商都在使用开源来处理大数据和运行预测分析。借助开源与云计算技术,新兴公司甚至在很多方面都可以与大厂商抗衡。

  以下是一些大数据方面的顶级开源工具,分为四个领域:数据存储、开发平台、开发工具和集成、分析和报告工具。

数据存储:

  • Apache Hadoop– Cloud Foundry(VMware), Hortonworks, Hadapt

  • NoSql 数据库 – MongoDB, Cassandra, Hbase

  • SQL 数据库 – MySql(Oracle), MariaDB, PostgreSQL, TokuDB

开发平台:

  • Apache Hadoop平台 – Impala(开源大数据分析引擎); Lingual(ANSI SQL); Pattern(analytics); Cascading(开源大数据应用程序开发框架)

  • Apache Lucene和 Solr平台

  • OpenStack(构建私有云和公有云)

  • Red Hat (搭载 Hadoop 服务器的标准 Linux 发行版)

  • REEF(微软的Hadoop开发者平台)

  • Storm(集成了各种排队系统和数据库系统)

开发工具和集成:

  • Apache Mahout(机器学习的编程语言)

  • Python 和 R(预测分析编程语言)

分析和报告工具:

  • Jaspersoft(报告和分析服务器)

  • Pentaho(数据集成和业务分析)

  • Splunk(IT分析平台)

  • Talend(大数据集成,数据管理和应用集成)

  以上就是我们总结的大数据方面不错的工具,希望对您有所帮助。

  英文原文: blackducksoftware

From:http://www.admin10000.com/document/4240.html

转载于:https://blog.51cto.com/dwf07223/1396140

强烈推荐!大数据领域的顶级开源工具大集合相关推荐

  1. 工业大数据漫谈9:开源工业大数据软件简介(上)

    今天真是一个美好的时代,有无数的开源系统可以为我们提供服务,现在有许多开发软件可以用到工业大数据中,当然很多系统还不成熟,应用到工业中还需要小心,并且需要开发人员对其进行一定的优化和调整.下面就简单介 ...

  2. 大数据可视化html模板开源_大数据时代-可视化数据分析平台必不可少

    公众号:不安分的猿人 一.项目简介 DataGear是一款数据管理与可视化分析平台,使用Java语言开发,采用浏览器/服务器架构,支持多种数据库, 主要功能包括数据管理.SQL工作台.数据导入/导出. ...

  3. FFA 议程上线!实时化浪潮下,Apache Flink 还将在大数据领域掀起怎样的变革?...

    Flink Forward Asia 2022 将于 11 月 26-27 日在线上举办,议程内容正式上线! 今年是 Flink Forward Asia(下文简称 FFA)落地中国的第五个年头,也是 ...

  4. 实时化浪潮下,Apache Flink还将在大数据领域掀起怎样的变革?

    Flink Forward Asia 2022 将于 11 月 26-27 日在线上举办,议程内容正式上线! 今年是 Flink Forward Asia(下文简称 FFA)落地中国的第五个年头,也是 ...

  5. 聚焦云计算、大数据、人工智能等开源技术,这场开源开发者的盛会不容错过!

    作为业界具有广泛影响力的开源年度盛会,2022 第七届中国开源年会 (COSCon'22) 将于 10 月 29 日 - 30 日在线上(元宇宙+传统线上直播渠道)& 线下(10+ 线下分会场 ...

  6. 大数据在线分析处理和常用工具

    大数据在线分析处理的特点 . 数据源源不断的到来: 数据需要尽快的得到处理,不能产生积压: 处理之后的数据量依然巨大,仍然后TB级甚至PB级的数据量: 处理的结果能够尽快的展现: 以上四个特点可以总结 ...

  7. 大数据基石-Hadoop3.x学习教程-大数据场景介绍

    大数据基石-Hadoop Hadoop3.x版本全系列教程 === 楼兰 === 文章目录 一.理解大数据 1.大数据的特点 2.大数据的应用方向 3.大数据的工作前景 二.大数据课程体系介绍 1.大 ...

  8. 荐六十款针对Hadoop和大数据顶级开源工具

    为什么80%的码农都做不了架构师?>>>    荐六十款针对Hadoop和大数据顶级开源工具 2015-08-10 10:37 布加迪编译 51CTO 字号: T |  T 说到处理 ...

  9. “鲜点”资讯:开源平台Apache Beam正式发布,2016大数据领域大事记全回顾

    "鲜点"资讯网罗新鲜要闻,每日为你呈现大数据和云计算领域热点新闻.本次内容播报如下: Uber 推出数据平台"Uber Movement",用实时数据帮政府治理 ...

  10. 开源的Blink和Spark3.0,谁将称霸大数据领域?

    来源 | 大数据技术与架构(import_bigdata) 作者 | 王知无,阿里巴巴高级大数据开发工程师,先后在京东.阿里等大型互联网公司从事大数据平台.实时计算和离线计算中间件和业务平台开发. 2 ...

最新文章

  1. Visual Studio 2008 Express版本下载
  2. 资料分享 | 数学建模竞赛备战大全
  3. 大数据电商数仓--记录各种奇奇怪怪的issue
  4. Python 路径问题--No such file or directory
  5. oracle open 101,解决oracle数据库ORA-65101 container database set up incorrectly
  6. 开源流媒体服务器:为何一定得再撸个新的 | 凌云时刻
  7. 总会用到的系列4:关键时刻能救家庭的保险
  8. 室外宽温1口千兆光纤收发器工业导轨式发送机接收机单模单纤单电口
  9. 盗贼之海服务器维护时间,盗贼之海常见问题解决方法
  10. 怎么修改teredo服务器,技术员设置win7系统通过teredo连接IPv6的修复方案
  11. 【ZFNet】Visualizing and Understanding Convolutional Networks (2013) 全文翻译
  12. 北理工python程序设计学习笔记——(三)turtle八边形绘制
  13. 更换SSD系统盘-PE重装系统
  14. 基于FPGA的数字钟设计实验报告
  15. 王学岗Kotlin协程(三)---协程的上下文与协程的异常处理
  16. python记录鼠标键盘操作自动执行重复工作
  17. SSD的三组成部件简介:主控芯片 闪存芯片 固件算法
  18. 美团2021校招笔试-编程题-第10场
  19. 全网最全的Java Socket通讯例子
  20. Echarts3实例 加载地图

热门文章

  1. 清除SQLServer2008缓存
  2. C#动态创建和动态使用程序集、类、方法、字段等(二)
  3. 理解createTrackbar函数
  4. Mysql 5.7 for windows 免安装版(解压版)安装和配置
  5. JDBC第三篇--【事务、元数据、改造JDBC工具类】
  6. linux系统root用户忘记密码的重置方法
  7. dropify插件的字符串
  8. HDU 1596 find the safest road
  9. mmo游戏开发应在profile下运行,才能保证正式运行不卡
  10. type与instance区别