流式计算:对无边界的数据进行连续不断的处理、聚合和分析流式计算应用场景
1.实时大屏
2.实时监控
3.实时风控
3.工业大数据模式一:原生流处理(Native)所有输入记录会一条接一条地被处理,上面提到的Storm和Flink都是采用的这种方式,但Flink还做了优化,通过设置缓冲块大小阈值/时间阈值毫秒级来触发数据块传输,可以平衡延迟和吞吐量,做到低延迟、高吞吐模式二:微批处理(Batch)
将输入的数据以某以时间间隔T,切分成多个微批量数据,然后对每个批量数据进行处理,Spark Streaming和StructedStreaming采用的是这种方式。record--->batch recordsSpark Streaming是Spark生态系统中的重要的框架,它建立在Spark Core之上
使用简单,容错性好,和spark无缝衔接SparkStreaming是一个基于SparkCore的实时计算框架,可以从很多数据源消费数据并对数据进行实时的处理,最后,可以将处理后的数据存储到HDFS、数据库和实时仪表板,具有高吞吐量和容错能力强等特点核心思想是:微批处理,当时间间隔BatchInterval较小时(一般为秒级),就像在做"实时"处理SparkStreaming数据抽象:DStream是SparkStreaming提供的基本数据抽象,它表示一个连续的数据流,DStream由一系列的RDD表示,每个RDD都包含来自特定间隔的数据,每个微批就是一个RDD,这些个时间上连续的RDD就组成了DStream,所以DStream本质上就是一系列时间上的连续的RDD,即DStream => Seq(RDD)

Spark-Streaming相关推荐

  1. Apache 流框架 Flink,Spark Streaming,Storm对比分析(一)

    https://bigdata.163.com/product/article/5 Apache 流框架 Flink,Spark Streaming,Storm对比分析(一) 转载于:https:// ...

  2. Spark Streaming笔记整理(二):案例、SSC、数据源与自定义Receiver

    [TOC] 实时WordCount案例 主要是监听网络端口中的数据,并实时进行wc的计算. Java版 测试代码如下: package cn.xpleaf.bigdata.spark.java.str ...

  3. Spark Streaming实践和优化

    2019独角兽企业重金招聘Python工程师标准>>> Spark Streaming实践和优化 博客分类: spark 在流式计算领域,Spark Streaming和Storm时 ...

  4. 基于大数据的Uber数据实时监控(Part 4:Spark Streaming、DataFrames和HBase)

    导言 根据Gartner的数据,到2020年全球将有208亿个连接产品投入使用.Uber机器学习负责人Danny Lange的目标是将机器学习待到Uber业务的每个角落.连接事物的示例包括联网汽车和设 ...

  5. 基于大数据的Uber数据实时监控(Part 2:Kafka和Spark Streaming)

    导言 本文是系列文章的第二篇,我们将建立一个分析和监控Uber汽车GPS旅行数据的实时示例.在第一篇文章中讨论了使用Apache Spark的K-means算法创建机器学习模型,以根据位置聚类Uber ...

  6. Spark Streaming与Kafka Streaming对比

    ♚ 叙述 对流处理的需求每天都在增加.原因是,处理大量数据通常是不够的. 必须快速处理数据,以便公司能够对不断变化的业务条件作出实时反应. 流处理是对数据进行连续.并行的实时处理. 流式处理是处理数据 ...

  7. Kafka:ZK+Kafka+Spark Streaming集群环境搭建(九)安装kafka_2.11-1.1.0

    如何搭建配置centos虚拟机请参考<Kafka:ZK+Kafka+Spark Streaming集群环境搭建(一)VMW安装四台CentOS,并实现本机与它们能交互,虚拟机内部实现可以上网.& ...

  8. Kafka:ZK+Kafka+Spark Streaming集群环境搭建(二十一)NIFI1.7.1安装

    一.nifi基本配置 1. 修改各节点主机名,修改/etc/hosts文件内容. 192.168.0.120master192.168.0.121slave1192.168.0.122 slave2 ...

  9. Spark Streaming高级特性在NDCG计算实践

    从storm到spark streaming,再到flink,流式计算得到长足发展, 依托于spark平台的spark streaming走出了一条自己的路,其借鉴了spark批处理架构,通过批处理方 ...

  10. Spark Streaming揭秘 Day9 从Receiver的设计到Spark框架的扩展

    Spark Streaming揭秘 Day9 从Receiver的设计到Spark框架的扩展 Receiver是SparkStreaming的输入数据来源,从对Receiver整个生命周期的设计,我们 ...

最新文章

  1. js创建对象的几种方法及继承
  2. Fastjson 1.2.68版本反序列化漏洞分析篇
  3. 【必知】国内最设计感的 App推荐
  4. java 异常 过滤器_在过滤器Filter中抛出一个全局异常可以捕获的异常
  5. linux虚拟机tomcat上部署web项目的常用命令
  6. php object keys_原生js中Object.keys方法详解
  7. 前端界面请假管理java_小程序新请假界面
  8. python requests 10041报错_Python:requests高级_模拟登陆
  9. 实验19:Frame-Relay
  10. Google Chrome谷歌浏览器中安装JsonView插件实现json数据转码、缩进、格式化的方法
  11. sim868 c++二次开发基本完成
  12. hdjs---laravel 框架使用hdjs 实现多图上传功能
  13. trajan 塔杨算法 求割点,割边
  14. Python之ASCII码相关
  15. 最简单的Go Dockerfile编写姿势
  16. php 日历设置当月节假_PHP实现的日历功能示例
  17. 计算机内存占用过高怎么办,电脑内存占用过高怎么办?
  18. 蓝桥杯——机器人行走(模拟类题目)Java语言实现
  19. 云计算三种服务模式之IasS介绍
  20. Zion医疗中心使用RTLS系统,减少气垫丢失概率

热门文章

  1. js进阶 14-6 $.ajax()方法如何使用
  2. HTML 上标题栏把右标题栏遮挡,如何编辑组件的样式(编辑样式)?
  3. iOS - OC 与 Swift 互相操作
  4. linux思考与实验答案,linux课后习题答案教材课后习题参考答案
  5. oracle lpad 字符集,oracle Lpad()函数和Rpad()函数的用法
  6. 黑马程序员_语句结构及数组
  7. html类名定义规则_好程序员分享Java语言中的标识符规则
  8. 使用sharding-jdbc实现水平分库+水平分表
  9. Java游戏小李飞镖,安全工程与虚拟技术部双节活动
  10. PDA地下电缆巡检系统