在运行SparkStreaming程序时,出现了这样的错
Couldn’t find leaders for Set([tt,1], [tt,2]))
这个异常意思是Spark找不到partition的Leader。查看监控后发现,在异常发生的时间点,有一个Broker挂掉了。可是对应Topic的replica设置的2,就算挂掉一个,应该有replica顶上啊。后来发现,这是由于存在Partition的Replica没有跟Leader保持同步更新,也就是通常所说的“没追上”。 查看某个Topic是否存在没追上的情况:
观察其中的Replicas和Isr是否一致,如果出现Isr少于Replicas,则对应Partition存在没追上的情况



解决方法:
增大num.replica.fetchers的值,此参数是Replicas从Leader同步数据的线程数,默认为1,增大此参数即增大了同步IO。经过测试,增大此值后,不再有追不上的情况

SparkStreaming读Kafka- Couldn't find leaders for Set相关推荐

  1. 读Kafka Consumer源码

    最近一直在关注阿里的一个开源项目:OpenMessaging OpenMessaging, which includes the establishment of industry guideline ...

  2. 使用idea编写SparkStreaming消费kafka中的数据,并对数据进行某一指标的处理【小案例】(五)

    接    使用idea编写SparkStreaming消费kafka中的数据[小案例](四) https://georgedage.blog.csdn.net/article/details/1035 ...

  3. sparkStreaming连接kafka整合hbase和redis

    sparkStreaming消费kafka数据,并将数据保存到redis和hbase当中去,实现实时 import org.apache.hadoop.hbase.client.{Admin, Con ...

  4. Spark-Streaming获取kafka数据的两种方式-Receiver与Direct的方式

    Spark-Streaming获取kafka数据的两种方式-Receiver与Direct的方式,可以从代码中简单理解成Receiver方式是通过zookeeper来连接kafka队列,Direct方 ...

  5. SparkStreaming读取Kafka数据源并写入Mysql数据库

    SparkStreaming读取Kafka数据源并写入Mysql数据库 一.实验环境 本实验所用到的工具有 kafka_2.11-0.11.0.2: zookeeper-3.4.5: spark-2. ...

  6. sparkStreaming 处理kafka数据积压问题

    使用SparkStreaming集成kafka时有几个比较重要的参数: spark.streaming.stopGracefullyOnShutdown (true / false)默认fasle 确 ...

  7. Flume 以twitter为source,kafka为channel,hdfs为sink,再用spark streaming 读kafka topic

    Flume 以twitter为source,kafka为channel,hdfs为sink,再用spark streaming 读kafka topic Flume的配置文件: kafka_twitt ...

  8. SparkStreaming整合Kafka(0.8.2.1)计算不同业务指标并实现累加(结合Redis)

    业务是订单成交信息,要求计算出成交总金额,每一类商品的金额,区域成交的金额这三个指标. 数据格式:C 202.102.152.3 家具 婴儿床 2000 SparkStreaming读取Kafka中的 ...

  9. 第91课:SparkStreaming基于Kafka Direct案例实战和内幕源码解密 java.lang.ClassNotFoundException 踩坑解决问题详细内幕版本

    第91课:SparkStreaming基于Kafka Direct案例实战和内幕源码解密    /* * *王家林老师授课http://weibo.com/ilovepains */  每天晚上20: ...

  10. SparkStreaming读取Kafka的Json数据然后保存到MySQL

    一般我们使用SparkStreaming消费kafka数据,获取到数据后解析,使用JDBC的方式写入数据库,如下所示. 以上的方式没什么毛病,但是当我们消费的kafka数据类型比较多样的时候,我们需要 ...

最新文章

  1. Opencv中除了cv2.cvtColor彩色图转灰度图之外的其他6种方法
  2. opencv mat用数组初始化_10、OpenCV中图像和Mat类型(一)
  3. ubuntu 下 object-c环境配置与hello world 编译
  4. 『Windows Tips』Windows 自带屏幕截图的使用
  5. python标准库和第三方库_python常用标准库及三方库
  6. mysql ft_mysql全文索引____ft_min_word_len
  7. hdu 2454 Degree Sequence of Graph G(可简单图化判定)
  8. 泸州计算机专业学院,泸州计算机专业中职推荐
  9. python打开方式错误_浅谈python 调用open()打开文件时路径出错的原因
  10. Ubuntu 10.10 下配置Telnet服务器
  11. kafka集群为什么需要三个节点_大白话带你认识 Kafka
  12. K8s创建pod yaml文件详解
  13. Perf -- Linux下的系统性能调优工具
  14. ETL工具——Taskctl Web应用篇
  15. docker安装bwapp
  16. xray使用初试-扫描登录后的APP
  17. 论文写作中插入公式间距变大怎么办?
  18. 河北工业大学开发能力训练之测风数据处理(一)
  19. pytest之parameterize参数化
  20. matlab仿真的英文文献,matlab 外文翻译 外文文献 英文文献 MATALAB 混合仿真平台控制算法的概述...

热门文章

  1. 把D盘的Program Files文件夹删除
  2. 基于区块链的内容社交平台,他们凭什么说比知乎更吸引人?
  3. 证券市场基础知识(一)——证券市场概述
  4. android java pbo_Android OpenGL ES 3.0 PBO而不是glReadPixels()
  5. 教你怎样用最少的钱拍出最美的婚纱
  6. css3新特性和其他常见问题(三)
  7. 【基于可见光定位的智能超市购物车系统】(四)可见光定位、电机驱动与整车设计
  8. 我爱Flask之URL和Flask视图介绍
  9. xp系统什么梗_电脑分区4K对齐,对系统的影响
  10. wikisql 数据集解释_【Wikidata】维基数据详解