目录

事件驱动型应用

数据分析型应用

数据管道型应用


Flink 功能强大,支持开发和运行多种不同种类的应用程序。它的主要特性包括:批流一体化、精密的状态管理、事件时间支持以及精确一次的状态一致性保障等。

事件驱动型应用

事件驱动型应用是一类具有状态的应用,它从一个或多个事件流提取数据,并根据到来的事件触发计算、状态更新或其他外部动作。

事件驱动型应用是在计算存储分离的传统应用基础上进化而来。在传统架构中,应用需要读写远程事务型数据库。相反,事件驱动型应用是基于状态化流处理来完成。在该设计中,数据和计算不会分离,应用只需访问本地(内存或磁盘)即可获取数据。系统容错性的实现依赖于定期向远程持久化存储写入 checkpoint。下图描述了传统应用和事件驱动型应用架构的区别。

典型的事件驱动型应用实例:

反欺诈

异常检测

基于规则的报警

业务流程监控

(社交网络)Web 应用

数据分析型应用

数据分析任务需要从原始数据中提取有价值的信息和指标。传统的分析方式通常是利用批查询,或将事件记录下来并基于此有限数据集构建应用来完成。为了得到最新数据的分析结果,必须先将它们加入分析数据集并重新执行查询或运行应用,随后将结果写入存储系统或生成报告。借助一些先进的流处理引擎,还可以实时地进行数据分析。和传统模式下读取有限数据集不同,流式查询或应用会接入实时事件流,并随着事件消费持续产生和更新结果。这些结果数据可能会写入外部数据库系统或以内部状态的形式维护。仪表展示应用可以相应地从外部数据库读取数据或直接查询应用的内部状态。

如下图所示,Apache Flink 同时支持流式及批量分析应用。

Flink 如何支持数据分析类应用?

Flink 为持续流式分析和批量分析都提供了良好的支持。具体而言,它内置了一个符合 ANSI 标准的 SQL 接口,将批、流查询的语义统一起来。无论是在记录事件的静态数据集上还是实时事件流上,相同 SQL 查询都会得到一致的结果。同时 Flink 还支持丰富的用户自定义函数,允许在 SQL 中执行定制化代码。如果还需进一步定制逻辑,可以利用 Flink DataStream API 和 DataSet API 进行更低层次的控制。此外,Flink 的 Gelly 库为基于批量数据集的大规模高性能图分析提供了算法和构建模块支持。

典型的数据分析应用实例:

电信网络质量监控

移动应用中的产品更新及实验评估分析

消费者技术中的实时数据即席分析

大规模图分析

数据管道型应用

提取-转换-加载(ETL)是一种在存储系统之间进行数据转换和迁移的常用方法。ETL 作业通常会周期性地触发,将数据从事务型数据库拷贝到分析型数据库或数据仓库。

数据管道和 ETL 作业的用途相似,都可以转换、丰富数据,并将其从某个存储系统移动到另一个。但数据管道是以持续流模式运行,而非周期性触发。因此它支持从一个不断生成数据的源头读取记录,并将它们以低延迟移动到终点。例如:数据管道可以用来监控文件系统目录中的新文件,并将其数据写入事件日志;另一个应用可能会将事件流物化到数据库或增量构建和优化查询索引。

下图描述了周期性 ETL 作业和持续数据管道的差异。

典型的数据管道应用实例:

电子商务中的实时查询索引构建

电子商务中的持续 ETL

[Flink] Flink的应用场景相关推荐

  1. 基于 Flink 的典型 ETL 场景实现

    简介: 本文将从数仓诞生的背景.数仓架构.离线与实时数仓的对比着手,综述数仓发展演进,然后分享基于 Flink 实现典型 ETL 场景的几个方案. 作者:买蓉 · 美团点评高级技术专家 整理:赵阳(F ...

  2. flink 出现反压场景, 异常场景造成Exceeded checkpoint tolerable failure threshold.

    flink 出现反压场景,异常场景造成Exceeded checkpoint tolerable failure threshold. 监控反压情况 根据算子的InPool, OutPool 的比例, ...

  3. 凌波微步Flink——Flink的技术逻辑与编程步骤剖析

    转载请注明出处:http://blog.csdn.net/dongdong9223/article/details/95459606 本文出自[我是干勾鱼的博客] Ingredients: Java: ...

  4. 大数据计算引擎之Flink Flink CEP复杂事件编程

    原文地址:大数据计算引擎之Flink Flink CEP复杂事件编程 复杂事件编程(CEP)是一种基于流处理的技术,将系统数据看作不同类型的事件,通过分析事件之间的关系,建立不同的时事件系序列库,并利 ...

  5. 凌波微步Flink——Flink API中的一些基础概念

    转载请注明出处:http://blog.csdn.net/dongdong9223/article/details/95355619 本文出自[我是干勾鱼的博客] Ingredients: Java: ...

  6. 分布式计算—MapReduce、Spark、Storm、Flink分别适用什么场景

    作者:ezaya 链接:https://www.zhihu.com/question/403840013/answer/1317631316 著作权归作者所有.商业转载请联系作者获得授权,非商业转载请 ...

  7. 【Flink】实时归因场景踩坑

    关注交流微信公众号:小满锅 背景 前几天思考了一个问题,在很多业务场景下,需要关注流量的来源或是某个业务哪个入口的流量最大,带来的效益最多,那么就涉及到流量的归因了.比如说,我是一个bilibili ...

  8. Flink异步io应用场景之流表join维表

    简介 维度表,作为数据仓库里面的概念,是维度属性的集合,比如时间维.地点维:可以是一个mysql或者cassandra,redis等存储,甚至是自己定义的一些api. 流表是kafka等流式数据. 根 ...

  9. 【Flink】Flink Flink 1.14 新特性预览

    1.概述 转载:Flink 1.14 新特性预览 简介: 一文了解 Flink 1.14 版本新特性及最新进展 本文由社区志愿者陈政羽整理,内容源自阿里巴巴技术专家宋辛童 (五藏) 在 8 月 7 日 ...

最新文章

  1. 闲话WPF之五(XAML中的类型转换)
  2. 数据结构与算法,每日一道
  3. 在中国,程序员是青春饭吗?
  4. wxWidgets:wxFont实例
  5. 说一下output子句
  6. 太原市初中计算机课程视频,初中全课程教学视频
  7. Github实用浏览器插件推荐
  8. 谈一谈Normalize.css
  9. Nginx安装/负载均衡/反向代理配置与调优
  10. 《利用python进行数据分析》第二版 第13章-Python建模库介 学习笔记
  11. matlab之创建图像轮廓图函数imcontour
  12. 7500字拆解林清轩:说透了的“数字化转型”还有什么秘密武器?
  13. Matlab基于颜色的车牌识别
  14. [转]Facebook 如何管理150亿张照片
  15. java开发工程师面试自我介绍_Java程序员面试如何自我介绍HR这一关
  16. 阿里云Mysql5.7 数据库恢复 qp.xb文件恢复数据
  17. airpods二代降噪吗_华强北 苹果二代三代 蓝牙耳机。最新款airpods 不跳电,真降噪。...
  18. 解包Assets.car
  19. PLSQL导出的SQL,中文乱码
  20. Product Oriented Recurrence(Codeforces Round #566 (Div. 2)E+矩阵快速幂+欧拉降幂)

热门文章

  1. C# : 操作Word文件的API - (将C# source中的xml注释转换成word文档)
  2. 动态规划位置hdu 4540 威威猫系列故事——打地鼠(动态规划)
  3. 2.权限管理准备工作:你应该知道的ASP.NET网站最基本的安全措施!
  4. 一个apache安装后无法启动的原因分析
  5. 处理Oracle 11g在用EXP导出时,空表不能导出
  6. SonarQube安装步骤 Windows10系统
  7. AutoWare 使用
  8. Java 实现享元(Flyweight)模式
  9. 再谈IE的浏览器模式和文档模式[转]
  10. Android文本输入框EditText方法说明和属性