然后我们再来比较一下spark和flink,可以看到

spark是虽然也是说是做流的处理,但是spark的架构实现是,基于微批处理的,也就是

来了数据,先攒一攒,攒够了一批以后,才去处理,他的延时,可以得到几百毫秒,甚至秒级别的,主要是因为,他还是基于,批处理的概念,进行数据处理

实际上就是把这个批处理,做的足够的小.只要足够的小,速度就会快一些,但是再小,也会受限于,批处理的这种设计.

所以spark的数据处理速度还是会慢一些.

但是对于flink来说,就不一样了,他没有批处理的概念,他就是来一条数据,就处理一条数据,所以flink可以做到

真正的毫秒级的数据处理.

我们可以看到spark采用了rdd模型,RDD是个数据集,也就是说,对于spark来说,

因为rdd是个数据集合,也就是spark处理数据的时候会把数据,攒一攒再处理,所以这就是spark慢的原因.

而flink是基于数据模型的数据流

大数据_Flink_流式处理_Flik Vs Spark streaming_Flink的特点---Flink工作笔记0007相关推荐

  1. 大数据_Flink_流式处理_简介_为什么要用Flink---Flink工作笔记0002

    技术交流QQ群[JAVA,C++,Python,.NET,BigData,AI]:170933152 1.数据如果是连续不断产生的话,这样就是数据流的按年,比如,聊天的数据,是有一条发一条, 或者,用 ...

  2. 大数据_Flink_数据处理_运行时架构8_数据传输和任务链---Flink工作笔记0023

    然后我们再来看上一步我们理解了数据流的执行,生成过程, 然后我们再来看数据流的传输以及任务链,因为如果需要知道 两个任务到底是如何合并的,这里就需要知道数据流传输和任务链才行. 首先我们要知道 1.一 ...

  3. 大数据_Flink_流式处理_简介_认识一下什么是BI中的ETL---Flink工作笔记0005

    技术交流QQ群[JAVA,C++,Python,.NET,BigData,AI]:170933152 ETL开发工程师 extraction是抽取数据,就是可以从关系型数据库,表,也可能是文本文件, ...

  4. 大数据_Flink_流式处理_简介_流数据处理的应用行业---Flink工作笔记0003

    技术交流QQ群[JAVA,C++,Python,.NET,BigData,AI]:170933152 流处理和批处理想必,就是低延时和吞吐量高,用就用的他这个特点. 如果,数据量特别大,可能一个批处理 ...

  5. 大数据_Flink_流式处理_简介_Flink的特点---Flink工作笔记0006

    然后我们再来看一下flink的特点 我们可以先看一下传统的左边的数据处理过程,其实就类似我们做的传统的web应用, 也可以想一下netty处理数据的过程, 可以把请求看成一个事件,可以看到,服务器启动 ...

  6. 大数据_Flink_流式处理_简介_流数处理的发展演变---Flink工作笔记0004

    技术交流QQ群[JAVA,C++,Python,.NET,BigData,AI]:170933152 我们先看一下传统的处理数据的架构, 可以看到我们一般都是后端,有个关系型数据库比如mysql,然后 ...

  7. 大数据_Flink_流式处理_简介_Flink是什么---Flink工作笔记0001

    技术交流QQ群[JAVA,C++,Python,.NET,BigData,AI]:170933152 是一个框架,分布式的处理引擎,对有状态的计算,有界无界,这个后面咱们说是什么意思. 用于对有界和无 ...

  8. 大数据_Flink_Java版_数据处理_窗口起始点和偏移量---Flink工作笔记0058

    上一节我们用数据测试,得到的结果是,[195,210)这是一个窗口,对吧, 很奇怪,为什么? 因为这里我们输入的第一个数据的时间戳是,199对吧,那么为什么不是 [199,214),为什么不是这样呢? ...

  9. Flume+Kafka+Spark Streaming实现大数据实时流式数据采集

    近年来,随着企业信息化建设的飞速发展,大数据应用的问题越来越备受关注.很多企业投入大量的人力.物力和财力建设企业大数据平台,平台建设工作涵盖数据采集.数据处理.数据存储.数据服务.数据展示以及数据质量 ...

最新文章

  1. React中使用setState
  2. C#--封装、继承、多态
  3. 寻仙服务器要维护多久,寻仙手游几天开一个区
  4. 一二三系列之CodeChef分块——Chef and Churu,Chef and Problems,Children Trips
  5. ssl提高组周六模拟赛【2018.9.8】
  6. JSP,JSF和EL简介
  7. python 的库如何开发_一篇文章入门Python生态系统
  8. 如何迁移整个git仓库
  9. 第22课 抽奖 《小学生C++趣味编程》
  10. Android:数据持久化、Environment、SharedPreferences、内部存储internalStorage
  11. DeBruijin DFS
  12. Asp.Net在SqlServer中的图片存取
  13. Silverlight入门
  14. Android游戏引擎汇总,android开发模拟器
  15. Himall商城Html文本帮助类HtmlContentHelper(2)
  16. 大数据开发培训课程:Hive的静态分区与动态分区
  17. MPB:中科院植物所杨文强组-​莱茵衣藻遗传连锁分析方法
  18. CodeForces 961G Partitions 题解
  19. Matlab基础学习(中)
  20. 安卓手机python开发环境_使用Python开发Android应用程序:第一节 在手机上配置Python运行环境...

热门文章

  1. 需要显卡还是cpu_装机应该在哪个硬件上省钱, CPU还是显卡, 看完本文就知道了...
  2. php get获取腾讯视频vid,获取腾讯视频源地址链接的方法
  3. Linux学习笔记---使用MfgTool工具烧写官方系统(一)
  4. python将json数据集转成voc xml文件
  5. 纵览轻量化卷积神经网络:SqueezeNet、MobileNet、ShuffleNet、Xception
  6. Win10 + CUDA10.1+pytorch手动安装
  7. MySql Cluster 集成安装,Centos,坑点集锦
  8. 2.移植uboot-添加2440单板,并实现NOR、NAND启动
  9. Linux 下的 sleep
  10. 23模式之: 工厂方法模式demo