SparkStreaming概述

1.1 Spark Streaming是什么


Spark流使得构建可扩展的容错流应用程序变得更加容易。
Spark Streaming用于流式数据的处理。Spark Streaming支持的数据输入源很多,例如:Kafka、Flume、Twitter、ZeroMQ和简单的TCP套接字等等。数据输入后可以用Spark的高度抽象原语如:map、reduce、join、window等进行运算。而结果也能保存在很多地方,如HDFS,数据库等。

和Spark基于RDD的概念很相似,Spark Streaming使用离散化流(discretized stream)作为抽象表示,叫作DStream。DStream 是随时间推移而收到的数据的序列。在内部,每个时间区间收到的数据都作为 RDD 存在,而DStream是由这些RDD所组成的序列(因此得名“离散化”)。所以简单来将,DStream就是对RDD在实时数据处理场景的一种封装。

1.2 Spark Streaming的特点

  • 易用

  • 容错

  • 易整合到Spark体系

SparkStreaming概述相关推荐

  1. 大数据技术之Spark(三) SparkStreaming

    文章目录 第1章 SparkStreaming 概述 1.1 Spark Streaming 是什么? 1.2 为什么要学习Spark Streaming(特点) 1.3 Spark Streamin ...

  2. 尚硅谷大数据技术Spark教程-笔记01【Spark(概述、快速上手、运行环境、运行架构)】

    视频地址:尚硅谷大数据Spark教程从入门到精通_哔哩哔哩_bilibili 尚硅谷大数据技术Spark教程-笔记01[Spark(概述.快速上手.运行环境.运行架构)] 尚硅谷大数据技术Spark教 ...

  3. 尚硅谷大数据技术Spark教程-笔记09【SparkStreaming(概念、入门、DStream入门、案例实操、总结)】

    尚硅谷大数据技术-教程-学习路线-笔记汇总表[课程资料下载] 视频地址:尚硅谷大数据Spark教程从入门到精通_哔哩哔哩_bilibili 尚硅谷大数据技术Spark教程-笔记01[SparkCore ...

  4. D32 SparkStreaming

    一.SparkStreaming概述 Spark Streaming类似于Apache Storm,用于流式数据的处理.根据其官方文档介绍,Spark Streaming有高吞吐量和容错能力强等特点. ...

  5. Spark Streaming介绍,DStream,DStream相关操作(来自学习资料)

    一. Spark Streaming介绍 1. SparkStreaming概述 1.1. 什么是Spark Streaming Spark Streaming类似于Apache Storm,用于流式 ...

  6. 大数据基础课第三课 spark_core、Spark_sqlSpark_streaming

    spark 入门 课程目标: 了解spark概念 知道spark的特点(与hadoop对比) 独立实现spark local模式的启动 1.1 spark概述 1.什么是spark 基于内存的计算引擎 ...

  7. Python基础学完了再学什么?

    Python基础学完了再学什么? 基础阶段学完Python 基础语法.python 容器.函数和文件操作.面向对象. python编程和web基础.Linux 操作系统多任务编程.Python 网络编 ...

  8. 【saprk Steaming】

    目录 一.spark-streaming概述 二.有状态计算:每一次计算之前的计算结果进行累加计算 三. 窗口计算 四.DStream与RDD相互转换 例题:卡口车辆 一.spark-streamin ...

  9. 2021年大数据Spark(四十四):Structured Streaming概述

    Apache Spark在2016年的时候启动了Structured Streaming项目,一个基于Spark SQL的全新流计算引擎Structured Streaming,让用户像编写批处理程序 ...

  10. spark学习基础篇1--spark概述与入门

    spark总结 一: spark 概述 1. Spark 是 分布式内存计算框架 Apache Spark 是一个快速的, 多用途的集群计算系统, 相对于 Hadoop MapReduce 将中间结果 ...

最新文章

  1. 使用傅里叶变换进行图像边缘检测
  2. 岗位内推 | 深睿医疗实验室招聘机器学习实习生
  3. [ubuntu 16.04]如何在新建的Anaconda环境中打开jupyter notebook
  4. SQL50题面试题(10-15)
  5. js 加入debug后可以进入controller_写给前端:让后端 CRUD Boy 失业—— Nest.js CRUD 教程
  6. 数学软件Maple使用教程
  7. 性别年龄论文阅读(4)——SSR-Net
  8. JAVA中this的四种用法的详解
  9. 什么是软件测试的缺陷指标,软件测试缺陷度量分析
  10. javascript写的日历控件(收藏)
  11. 量化投资中常用python代码分析(一)
  12. android的app图标大全,安卓app图标
  13. HZ服务器装系统速度变慢,360Hz刷新率有些什么厉害的地方?响应时间系统延迟测试...
  14. 【Lua从青铜到王者基础篇】第十二篇:Lua错误处理
  15. Strings、bytes and runes -- 就要学习Go语言
  16. 将大文件 分卷 压缩
  17. java优化编程 第2版_Java优化编程(第2版)林胜利、王坤茹 pdf
  18. 过滤软件“绿坝”分析报告
  19. Selenium面试问题和答案-2
  20. 微软黑屏,为什么这么强势

热门文章

  1. 锯齿波FMCW测距、测速的原理
  2. 02 JS实现时钟效果
  3. 经济可行性分析的目的
  4. scheduling jobs未起来
  5. webp格式怎么改png?如何将webp转换格式?
  6. app开发人员配置【职责】
  7. [转帖]「白帽黑客成长记」Windows提权基本原理(上)
  8. 大理古城“八戒”“悟空”与游客互殴 警方已介入
  9. 融云「音视频架构实践」技术专场【内含完整PPT】
  10. 怎么在服务器上接无线路由器,从别人家拉网线再接无线路由器怎么设置?(二)...