一、有状态的流式处理

Apache Flink 是一个分布式流处理器,具有直观和富有表现力的API,可实现有状态的流处理应用程序。它以容错的方式有效地大规模运行这些应用程序。Flink 于2014 年4 月加入Apache 软件基金会作为孵化项目,并于2015 年1 月成为顶级项目。从一开始,Flink 就拥有一个非常活跃且不断增长的用户和贡献者社区。到目前为止,已有超过五百人为Flink 做出贡献,并且它已经发展成为最复杂的开源流处理引擎之一,并得到了广泛采用的证明。Flink 为不同行业和全球的许多公司和企业提供大规模的商业关键应用。

流处理技术在大大小小的公司中越来越受欢迎,因为它为许多已建立的用例(如数据分析,ETL 和事务应用程序)提供了卓越的解决方案,同时也促进了新颖的应用程序,软件架构和商机。接下来我们将讨论,为什么有状态流处理变得如此受欢迎并评估其潜力。我们首先回顾传统的数据应用程序架构并指出它们的局限性。接下来,我们介绍基于状态流处理的应用程序设计与传统方法相比,它具有许多有趣的特征最后,我们简要讨论开源流处理器的发展,并在本地Flink 实例上运行流应用程序。

1、传统数据处理架构

数十年来,数据和数据处理在企业中无处不在。多年来,数据的收集和使用一直在增长,公司已经设计并构建了基础架构来管理数据。大多数企业实施的传统架构区分了两种类型的数据处理:事务处理(OLTP)和分析处理(OLAP)。

大数据技术Flink详解相关推荐

  1. Hadoop大数据技术栈详解

    一.大数据概述 1.大数据简介 大数据(Big Data)∶指无法在一定时间范围内用常规软件工具进行捕捉.管理和处理的数据集合,是需要新处理模式才能具有更强的决策力.洞察发现力和流程优化能力的海量.高 ...

  2. 大数据技术Hive详解

    一.Hive 概述 1.Hive 简介 Hive:由Facebook开源用于解决海量结构化日志的数据统计. Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类S ...

  3. 2019年大数据发展现状详解,现在学习晚不晚!

    大数据时代,大数据分析与应用大肆盛行.越来越多的大公司大企业大集团,都越来越重视大数据的影响和作用.可以说,谁想抢得大数据的一手可靠资料,谁就在未来的业务发展和拓宽中占据优势,谁就会在相关领域首先拔得 ...

  4. 大数据学习路线详解,零基础学大数据学习路线

    在大数据蓬勃发展的现今,大家都看到了大数据未来不可限量的发展前景,跟着科技发展的潮流,不断学习新的技术知识,科多大数据相信,成为人生赢家不在话下. 大数据的三个发展方向,平台搭建/优化/运维/监控.大 ...

  5. 一文搞懂大数据开发,大数据开发体系详解

    前言 不知道大家有没有过在搜索引擎搜索过旅游的关键字,不久就可能收到机票的推销的经验.如今是大数据的时代,数据的价值越来越重要.数据即资产,想必大家都听说过.最近公司的项目中也用到了一些大数据的技术, ...

  6. 大数据Lambda架构详解

    1. 前言 随着互联网技术的发展,每一个业务都与数据息息相关,如搜索,推荐.这些业务有一个共同的特点是连接用户和数据.随着数据量的不断增加,对大数据的处理的要求也就会越来越高,在这期间出现了很多大数据 ...

  7. 中台唯一的胜利果实:大数据中台架构详解

    提起业务流量,除了全民抢票平台 12306,当数阿里最有发言权. 上到双十一千亿级流量洪峰,下到日均百万.千万交易量的平台,每个业务模块背后的高并发架构理念,无处不在. 成熟的架构设计只是其一,要取得 ...

  8. mapreduce 丢数据_大数据之MapReduce详解

    1.什么是Map/Reduce,看下面的各种解释: (1)MapReduce是hadoop的核心组件之一,hadoop要分布式包括两部分,一是分布式文件系统hdfs,一部是分布式计算框,就是mapre ...

  9. mapreduce编程规范_大数据之MapReduce详解

    今天要讲的是MapReduce 目录 今天先总体说下MapReduce的相关知识,后续将会详细说明对应的shuffle.mr与yarn的联系.以及mr的join操作的等知识.以下内容全是个人学习后的见 ...

最新文章

  1. Netty - ByteBuf
  2. VsCode中配置git
  3. 2020-12-28 Matlab自动化控制-Adrc自抗扰控制
  4. [云炬商业计划书阅读分享]洗车店创业计划书
  5. Spring里Bean类的运行时小写之谜
  6. 全国高等学校计算机等级考试(江西考区)一级笔试试卷a,全国高等学校计算机等级考试(江西考区)一级笔试试卷A...
  7. SQL2000里的数据类型
  8. [Spark][Python]Spark 访问 mysql , 生成 dataframe 的例子:
  9. PCL点云学习(1)——pcd文件的生成和读取
  10. 微信小程序周报(第十一期)-极乐商店出品
  11. Bootstrap系列 -- 36. 向上弹起的下拉菜单
  12. POJ 1811 Prime Test
  13. 在 Linux 上配置一个 syslog 服务器
  14. php+ci对mysql进行增删改查
  15. Same Tree - LeetCode
  16. 软件测试常见面试题汇总大纲
  17. 基于Java的超市水果管理系统_技术分享 - 基于JAVA SWING结合链表的水果超市管理系统...
  18. div半透明背景,文字不透明
  19. 相机快门、 光圈有啥区别?
  20. 安装python3.8出现ModuleNotFoundError: No module named ‘_ctypes’解决办法

热门文章

  1. 基于NLP的书法字体分析、统计及可视化
  2. UG NX 12 组件装配约束
  3. 设置IE浏览器的版本方式
  4. 收藏!闲鱼卖货实操,小白轻松入门
  5. Linux账号与身份管理
  6. 雷军微博拧螺丝,CFO为粉丝数发愁
  7. python语言编写爬虫_自写Python小爬虫一个 - 『编程语言区』 - 吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn...
  8. android免root管理自动启动不了,真正免root的Autostarts(管理自启)详细使用教程...
  9. 南邮 OJ 2001 水獭看动漫
  10. 量子计算--复习+量子信息--铺垫(学习笔记)