大数据已然成为当今最热门的技术之一,正呈爆炸式增长。每天来自全球的新项目如雨后春笋般涌现。幸运地是,开源让越来越多的项目可以直接采用大数据技术,下面就来盘点最受欢迎的十大开源的大数据技术。

大数据

  1. hadoop ——高效、可靠、可伸缩,能够为你的数据存储项目提供所需的YARN、HDFS和基础架构,并且运行主要的大数据服务和应用程序。
  2. Spark ——使用简单、支持所有重要的大数据语言(Scala、Python、Java、R)。拥有强大的生态系统,成长迅速,对 microbatching/batching/SQL支持简单。Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
  3. NiFi ——Apache NiFi是由美国国家安全局(NSA)贡献给Apache基金会的开源项目,其设计目标是自动化系统间的数据流。基于其工作流式的编程理念,NiFi非常 易于使用、强大、可靠、高可配置。两个最重要的特性是其强大的用户界面和良好的数据回溯工具。堪称大数据工具箱里的瑞士军刀。
  4. Apache Hive 2.1 ——Hive是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。随着最新版本的发布,性能和功能都得到了全面提升,Hive已成为SQL在大数据上的最佳解决方案。
  5. Kafka ——Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模网站中的所有动作流数据。它已成为大数据系统在异步和分布式消息之间的最佳选择。从Spark到NiFi再到第三方插件工具以至于Java到Scala,它都提供了强大的粘合作用。
  6. Phoenix —是HBase的SQL驱动。目前大量的公司采用它,并扩大其规模。HDFS支持的NoSQL能够很好地集成所有工具。Phoenix查询引擎会将SQL查询转换为一个或多个HBase scan,并编排执行以生成标准的JDBC结果集。
  7. Zeppelin ——Zeppelin 是一个提供交互数据分析且基于Web的笔记本。方便你做出可数据驱动的、可交互且可协作的精美文档,并且支持多种语言,包括 Scala(使用 Apache Spark)、Python(Apache Spark)、SparkSQL、 Hive、 Markdown、Shell等。
  8. Sparkling Water ——H2O填补了Spark’s Machine Learning的缺口,它可以满足你所有的机器学习。
  9. Apache Beam ——在Java中提供统一的数据进程管道开发,并且能够很好地支持Spark和Flink。提供很多在线框架,开发者无需学习太多框架。
  10. Stanford CoreNLP ——自然语言处理拥有巨大的增长空间,斯坦福正在努力增进他们的框架。

本文转自d1net(转载)

程序员需要关注的十个大数据技术相关推荐

  1. Java程序员必备的10个大数据框架

    当今IT开发人员面对的最大挑战就是复杂性,硬件越来越复杂,OS越来越复杂,编程语言和API越来越复杂,我们构建的应用也越来越复杂.根据外媒的一项调查报告,小千列出了Java程序员在过去12个月内一直使 ...

  2. 程序员如何进入人工智能和大数据领域

    想要进入人工智能和大数据领域,程序员可以考虑以下几个方面: 学习相关技术:程序员需要掌握人工智能和大数据相关的技术,比如机器学习.深度学习.数据挖掘.大数据处理等等.可以通过在线课程.自学.培训机构等 ...

  3. 【送书福利-第四期】从程序员到架构师:大数据量、缓存、高并发、微服务、多团队协同等核心场景实战书籍

    大家好,我是洲洲,欢迎关注,一个爱听周杰伦的程序员.关注公众号[程序员洲洲]即可获得10G学习资料.面试笔记.大厂独家学习体系路线等-还可以加入技术交流群欢迎大家在CSDN后台私信我! 送书福利-第四 ...

  4. 大数据时代,为什么很多JAVA程序员会转型做JAVA大数据

    分享之前推荐一个大数据交流学习群:722680258零基础进阶高级,需要学习大数据欢迎加入 JAVA的精密,强大,拥有其它语言不可替代的性能和可维护性,早已经是成为最受欢迎的编程语言之一,很多人想进入 ...

  5. 老程序员告诉你什么是大数据框架

    大数据架构是用于摄取和处理大量数据(通常称为"大数据")的总体系统,因此可以针对业务目的进行分析.该架构可视为基于组织业务需求的大数据解决方案的蓝图.大数据架构旨在处理以下类型的工 ...

  6. 好程序员分享:浅谈大数据时代的大数据技术与应用

    从某种程度上说,大数据是数据分析的前沿技术.简言之,从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术.明白这一点至关重要,也正是这一点促使该技术具备走向众多企业的潜力. 大数据给互联网 ...

  7. 从事程序员的工作,Python大数据、Java、前端,哪个有发展前景?

    首先我说大数据,现在有很多培训机构培训大数据,根据我多年的从业经验来看,大数据这名字听着不错,好像很高大上.但所谓培训"零基础"的.没有做过开发的人去学习大数据,就跟过家家是一样的 ...

  8. 2020年Java程序员不得不学习的10大技术

    对于Java开发人员来说,最近几年的时间中,Java生态诞生了很多东西.每6个月更新一次Java版本,以及发布很多流行的框架,如Spring 5.Spring Security 5和Spring Bo ...

  9. 原创 | 2020年Java程序员应该学习的10大技术

    对于Java开发人员来说,最近几年的时间中,Java生态诞生了很多东西.每6个月更新一次Java版本,以及发布很多流行的框架,如Spring 5.Spring Security 5和Spring Bo ...

最新文章

  1. 15万人调查发现:做博后越久,一辈子挣的钱越少
  2. C# Lambda表达式
  3. Swift 数字字符串格式化
  4. 怎样才能提高搜索引擎对网站的信任度?
  5. 设计模式——门面(外观)模式
  6. oracle常用的监控,oracle常用的监控语句
  7. 三层架构与MVC的区别
  8. cmd代码表白_手把手教你把Python代码转成exe
  9. 爬虫学习之-Python list 和 str 互转
  10. 从事IT行业的应该如何学习最高效的休息方式 1
  11. JavaScript学习简单总结
  12. 【程序逻辑】数据时代的推断陷阱尔雅答案
  13. bzoj-4565-区间dp+状压
  14. 怎么将PDF文件转换成Word文档?
  15. easyUI双击事件,完整总结
  16. java后台实现HTTPS协议方法
  17. 为什么程序员怕改需求?
  18. mars3d-canvans风向图支持自定义绘制局部区域
  19. java综合技术分享
  20. 使用Guardium和Privileged Identity Manager(PIM)缓解内部威胁

热门文章

  1. 系统间数据交互注意项
  2. jquery mobile资源
  3. SVN忽略不必要的配置文件
  4. 《.NET设计规范 约定、惯用法与模式》读书笔记
  5. 商战特训营 竞合赛场显英才
  6. centos 下编译 gcc
  7. CentOS 7.2安装Jenkins自动构建Git项目
  8. Xcode9学习笔记63 - 使用SystemSoundId播放简短声音(太长的无法播放)
  9. 第一次scrum冲刺
  10. 生成javascript正则表达式语法图