Spark Streaming的Receiver和Direct容错方式
Receiver容错:
Reveiver两种出错方式
①WAL预写出现问题,因为我们offset没有更新,所以可以从kafka中重新拉取数据
②处理时出现问题,导致进程挂掉,通过ResourceManager找到另外的worker节点上来启动AM,AM找到对应的container,从checkpoint恢复这些上下文代码逻辑计算。数据可以从WAL中进行获取,重新跑起来,数据处理成功后,从memory内存中删除,再从WAL中删掉,更新Offset
Direct 容错
ZK/redis/mysql保存offset-end就可以。
Direct模式,容错由Kafka保证
如果1,2数据块执行失败,offset没有更新,进行重新拉取到memory内存中
Spark Streaming的Receiver和Direct容错方式相关推荐
- Spark-Streaming获取kafka数据的两种方式-Receiver与Direct的方式
Spark-Streaming获取kafka数据的两种方式-Receiver与Direct的方式,可以从代码中简单理解成Receiver方式是通过zookeeper来连接kafka队列,Direct方 ...
- 根据官网文档看Spark Streaming对接Kafka的两种方式, 以及如何实现Exactly Once语义
注: 本文算是本人的学习记录, 中间可能有些知识点并不成熟, 不能保证正确性. 只能算是对官网文档作了个翻译和解读, 随时有可能回来更新和纠错 上一篇文章讨论了Spark Streaming的WAL( ...
- spark spark streaming + kafka receiver方式消费消息
2019独角兽企业重金招聘Python工程师标准>>> kafka + spark streaming 集群 前提: spark 安装成功,spark 1.6.0 zookeeper ...
- 如何选择Spark Streaming 的Reveiver和Direct模式
Receiver 这里的kafka获取数据其实是从HDFS中获取(WAL机制)(恢复时间较长) task相当于一个线程 这里一个Executor中的多个task共同处理一个data中的数据,这里可以通 ...
- Spark Streaming笔记整理(二):案例、SSC、数据源与自定义Receiver
[TOC] 实时WordCount案例 主要是监听网络端口中的数据,并实时进行wc的计算. Java版 测试代码如下: package cn.xpleaf.bigdata.spark.java.str ...
- Spark Streaming Direct Approach (No Receivers) 分析
前言 这个算是Spark Streaming 接收数据相关的第三篇文章了. 前面两篇是: Spark Streaming 数据产生与导入相关的内存分析 Spark Streaming 数据接收优化 S ...
- 编程实现将rdd转换为dataframe:源文件内容如下(_第四篇|Spark Streaming编程指南(1)
Spark Streaming是构建在Spark Core基础之上的流处理框架,是Spark非常重要的组成部分.Spark Streaming于2013年2月在Spark0.7.0版本中引入,发展至今 ...
- Spark Streaming 编程指南[中英对照]
2019独角兽企业重金招聘Python工程师标准>>> 基于Spark 2.0 Preview的材料翻译,原[英]文地址: http://spark.apache.org/docs/ ...
- 深入理解Spark Streaming执行模型
摘要:Spark Streaming是Spark中最常用的组件之一,将会有越来越多的有流处理需求的用户踏上Spark的使用之路.本文描述了Spark Streaming的架构并解释如何去提供上述优势, ...
最新文章
- CentOS7.5(64位)安装Anaconda
- 网络工程师学习资料:路由器配置案例分析
- 浅析网站外链优劣如何判定?
- react hooks使用_何时使用React Suspense和React Hooks
- Python机器学习:多项式回归002scikit中的多项式回归与pipeline(管道)
- 一种新的人机交流方式——sound ware 声件
- 软件工程专业学python_笨办法学Python(0)
- TypeError: Cannot read property ‘forceUpdate‘ of undefined
- 用粉红噪声煲机_煲机知识 | 煲机常用的粉红噪音和白噪音是什么?
- JavaFX Scene Builder的使用
- free-mybatis-plugin插件下载
- matlab用图像,Matlab常用图像操作
- The Preliminary Contest for ICPC Asia Xuzhou 2019 徐州网络赛 B so easy
- iOS项目添加pch文件
- numpy 归一化 与 标准化
- 网络规划设计师复习笔记--网络需求分析
- linux修改键盘按键
- 【AWVS】python调AWVS接口 新建扫描并导出扫描报告(一)
- Ubuntu 18下安装tensorflow(基于python3.6)
- MySQL及数据库部分笔记
热门文章
- potala(5)——Unit Test and Cache
- Java之volatile
- 用python解决约瑟夫环
- SEO优化:WordPress发布文章主动推送到百度,加快收录保护原创
- eclipse启动优化文章集合
- 【数据结构笔记32】排序算法概述、简单排序(冒泡排序、插入排序)、逆序对
- FPGA实现VGA显示(六)——————多字符显示及基于fpga的“打字机”实现
- Tip:创建SCOM 2012 R2报表服务器时的报错
- html5的所有标签页,HTML5所有标签总集
- antd的table遍历之后添加合计行_付费?是不可能的!20行Python代码实现一款永久免费PDF编辑工具...