根据一些公开资料整理,也许有失偏颇,仅供参考:

1.第一代

Hadoop 承载的 MapReduce

2.第二代

支持 DAG(有向无环图) 的框架: Tez 、 Oozie,主要还是批处理任务

3.第三代

Job 内部的 DAG(有向无环图) 支持(不跨越 Job),以及强调的实时计算:Spark

4.第四代

对流计算的支持,以及更一步的实时性:Flink

SparkStreaming VS Flink Streaming

转载于:https://www.cnblogs.com/liugh/p/7823480.html

大数据计算引擎发展的四个阶段相关推荐

  1. spark大数据计算引擎原理深剖(优缺点)-spark简介

    用spark,你仅仅只是调用spark的API肯定是很low的. 今天来讲讲spark的原理,并且会针对部分源码进行讲解,如有不同意见请联系本人交流探讨. 目前大数据生态主要部分是Hadoop软件框架 ...

  2. 上:Spark VS Flink – 下一代大数据计算引擎之争,谁主沉浮?

    作者简介 王海涛,曾经在微软的 SQL Server和大数据平台组工作多年.带领团队建立了微软对内的 Spark 服务,主打 Spark Streaming.去年加入阿里实时计算部门,参与改进阿里基于 ...

  3. 轻量级大数据计算引擎esProc SPL,Hadoop Spark太重

    前言 背景:随着大数据时代的来临,数据量不断增长,传统小机上跑数据库的模式扩容困难且成本高昂,难以支撑业务发展. 应对之法:很多用户开始转向分布式计算路线,用多台廉价的PC服务器组成集群来完成大数据计 ...

  4. 大数据计算引擎之Flink Flink CEP复杂事件编程

    原文地址:大数据计算引擎之Flink Flink CEP复杂事件编程 复杂事件编程(CEP)是一种基于流处理的技术,将系统数据看作不同类型的事件,通过分析事件之间的关系,建立不同的时事件系序列库,并利 ...

  5. Apache Flink 为什么能够成为新一代大数据计算引擎?

    众所周知,Apache Flink(以下简称 Flink)最早诞生于欧洲,2014 年由其创始团队捐赠给 Apache 基金会.如同其他诞生之初的项目,它新鲜,它开源,它适应了快速转的世界中更重视的速 ...

  6. Spark 凭什么成为最火的大数据计算引擎?

    这年代,做数据的,没人不知道 Spark 是什么吧.作为最火的大数据计算引擎,现在基本上是各互联网大厂的标配了. 比如,字节跳动基于 Spark 构建的数据仓库,服务了几乎所有的产品线,包括抖音.今日 ...

  7. 大数据(三)大数据计算引擎

    文章目录 说明 分享 大数据计算引擎 批处理 MapReduce tez 流批处理 Flink spark 总结 说明 本博客每周五更新一次. 介绍过大数据平台的搭建.应用和存储,本期分享下大数据计算 ...

  8. 揭秘阿里云EB级大数据计算引擎MaxCompute

    日前,全球权威咨询与服务机构Forrester发布了<The Forrester WaveTM: Cloud Data Warehouse, Q4 2018>报告.这是Forrester ...

  9. 为什么Spark能成为最火的大数据计算引擎?它是怎样工作的?

    导读:零基础入门Spark必读. 作者:朱凯 来源:大数据DT(ID:hzdashuju) 01 概述 十年前我们只有Hadoop,大家首先通过HDFS实现海量数据的共享存储,然后使用MapReduc ...

最新文章

  1. 【spring】使用eclipse在没网时编写配置文件无法获取提示 解决方法
  2. AOI光学自动检测技术 | 基本原理与设备构成
  3. Rsync文件同步服务
  4. linux应用程序是什么,linux下c开发了一个应用程序,它的扩展名是什么?
  5. oracle导入 不是dba,IMP-00013只有DBA才能导入由其他DBA导出的文件
  6. 【Python】IDE环境Pycharm运行虚拟环境Django
  7. 操作系统之计算机系统概述:1、操作系统概述(定义、功能、作用)
  8. 使用EntityFramework Core和Enums作为字符串的ASP.NET Core Razor页面——第三部分
  9. iOS Unicode转中文(UTF-8)
  10. JSP基础之九九乘法表(利用JSP脚本段制作一张九九乘法表)
  11. android qq勋章动画,qq最新的勋章怎么获得?教你最快刷满10个勋章
  12. 求指教,PSO算法跟踪光伏电池最大功率点
  13. 2021年烷基化工艺考试试卷及烷基化工艺模拟考试题
  14. 你玩过轻量系统软总线应用吗?
  15. python文本信息对比
  16. shell中遍历字符串
  17. 一个C病毒 - -!
  18. 留言获赠书 | 朱春雷:Rust编程:入门 实战与进阶
  19. 13-goroutine创建过程
  20. Python——PCA主成分分析

热门文章

  1. 语音网关上AA的配置解析
  2. oracle中的数据集合操作
  3. 洛谷4147:玉蟾宫——题解
  4. 浅谈高风险多团队协同的项目管理方法
  5. Suse es 11sp2 双网卡冗余
  6. 更改SQL 2005登录时的默认数据库
  7. 创建与SharePoint 2010风格一致的下拉菜单 (续) 整合Feature Custom Action框架
  8. this super 在接口以及实现类中所指的对象
  9. 4.5.2 OSPF协议与链路状态算法
  10. 数字信道化中的兔耳效应