问题复现

近日针对某一客户需求开发了一个需要使用Kafka的功能,功能是什么暂且不论,在本地虚机的Kafka连接一切正常遂放到测试服务器上验证功能,以下是监听topic成功和警告报错:

2023-05-09 10:22:23 [localhost-startStop-1] INFO  org.apache.kafka.clients.consumer.ConsumerConfig - ConsumerConfig values: allow.auto.create.topics = trueauto.commit.interval.ms = 5000auto.offset.reset = earliestbootstrap.servers = [10.39.48.113:9092]check.crcs = trueclient.dns.lookup = use_all_dns_ipsclient.id = consumer-enn-jiuqi-1client.rack = connections.max.idle.ms = 540000default.api.timeout.ms = 60000enable.auto.commit = falseexclude.internal.topics = truefetch.max.bytes = 52428800fetch.max.wait.ms = 500fetch.min.bytes = 1group.id = enn-jiuqigroup.instance.id = nullheartbeat.interval.ms = 3000interceptor.classes = []internal.leave.group.on.close = trueinternal.throw.on.fetch.stable.offset.unsupported = falseisolation.level = read_uncommittedkey.deserializer = class org.apache.kafka.common.serialization.StringDeserializermax.partition.fetch.bytes = 1048576max.poll.interval.ms = 300000max.poll.records = 500metadata.max.age.ms = 300000metric.reporters = []metrics.num.samples = 2metrics.recording.level = INFOmetrics.sample.window.ms = 30000partition.assignment.strategy = [class org.apache.kafka.clients.consumer.RangeAssignor, class org.apache.kafka.clients.consumer.CooperativeStickyAssignor]receive.buffer.bytes = 65536reconnect.backoff.max.ms = 1000reconnect.backoff.ms = 50request.timeout.ms = 30000retry.backoff.ms = 100sasl.client.callback.handler.class = nullsasl.jaas.config = nullsasl.kerberos.kinit.cmd = /usr/bin/kinitsasl.kerberos.min.time.before.relogin = 60000sasl.kerberos.service.name = nullsasl.kerberos.ticket.renew.jitter = 0.05sasl.kerberos.ticket.renew.window.factor = 0.8sasl.login.callback.handler.class = nullsasl.login.class = nullsasl.login.refresh.buffer.seconds = 300sasl.login.refresh.min.period.seconds = 60sasl.login.refresh.window.factor = 0.8sasl.login.refresh.window.jitter = 0.05sasl.mechanism = GSSAPIsecurity.protocol = PLAINTEXTsecurity.providers = nullsend.buffer.bytes = 131072session.timeout.ms = 45000socket.connection.setup.timeout.max.ms = 30000socket.connection.setup.timeout.ms = 10000ssl.cipher.suites = nullssl.enabled.protocols = [TLSv1.2]ssl.endpoint.identification.algorithm = httpsssl.engine.factory.class = nullssl.key.password = nullssl.keymanager.algorithm = SunX509ssl.keystore.certificate.chain = nullssl.keystore.key = nullssl.keystore.location = nullssl.keystore.password = nullssl.keystore.type = JKSssl.protocol = TLSv1.2ssl.provider = nullssl.secure.random.implementation = nullssl.trustmanager.algorithm = PKIXssl.truststore.certificates = nullssl.truststore.location = nullssl.truststore.password = nullssl.truststore.type = JKSvalue.deserializer = class org.apache.kafka.common.serialization.StringDeserializer2023-05-09 10:22:23 [localhost-startStop-1] INFO  org.apache.kafka.common.utils.AppInfoParser - Kafka version: 3.0.1
2023-05-09 10:22:23 [localhost-startStop-1] INFO  org.apache.kafka.common.utils.AppInfoParser - Kafka commitId: 8e30984f43e64d8b
2023-05-09 10:22:23 [localhost-startStop-1] INFO  org.apache.kafka.common.utils.AppInfoParser - Kafka startTimeMs: 1683598943212
2023-05-09 10:22:23 [localhost-startStop-1] INFO  org.apache.kafka.clients.consumer.KafkaConsumer - [Consumer clientId=consumer-test-1, groupId=test-group] Subscribed to topic(s): sync_user2023-05-09 10:23:50 [org.springframework.kafka.KafkaListenerEndpointContainer#0-0-C-1] WARN  org.apache.kafka.clients.NetworkClient - [Consumer clientId=consumer-test-1, groupId=test-group] Bootstrap broker 10.39.48.113:9092 (id: -1 rack: null) disconnected

可以注意到日志最后有1条警告,其实我只放了一条,这个信息在日志里多滴很。

分析问题

客户对接方发送了一条消息问我们消费到没,我一查日志,满屏是WARN提示 Bootstrap broker 10.39.48.113:9092 (id: -1 rack: null) disconnected,真是小刀拉屁股——开了眼。

打开Google Bard机器人问问这是啥原因导致的:

可能是网络原因导致的,查了下其他博客说也有可能是开启了某种认证机制导致的。

通过ping发现能ping通broker,但是通过telnet却无法连接了,也就是说:这台测试服务器与kafka broker间的网络被限制为可以ping但不能访问broker的端口号!

解决办法

查看了下测试服务器的iptables链没发现问题,自己通过tcpdump抓包用wireshark分析发现只有SYN包没响应,找到客户网络工程师定位到是公司的网络策略限制了。至此问题解决,希望能给读者一个思路。

【问题解决】Kafka报错 Bootstrap broker x.x.x.x:9092 (id: -1 rack: null) disconnected相关推荐

  1. kafka发送数据报错: Error connecting to node xxxxx:9092 (id: 1 rack: null)java.net.UnknownHostExceptio

    报错内容: warn报错: [kafka-producer-network-thread | producer-1] WARN  org.apache.kafka.clients.NetworkCli ...

  2. 【kafka】kerberos认证下 kafka 报错Bootstrap broker host:ip (id: -1 rack: null) disconnected

    文章目录 1.概述 1.概述 本博文中的IP都是随便写的. 公司整了一个新的环境,然后我要进行适配,结果发现对方有认证,无法直接使用,使用控制台生产和消费的时候报错. [domain_realm][r ...

  3. kafka报错:Bootstrap broker localhost:9092 (id: -1 rack: null) disconnected

    这是一个惨痛的教训 就在昨天我和我四个同事因为这个问题搞到了夜里十一点半,啊啊啊啊啊!!!太恶心了!!! 在启动工程时,kafka报这个错误,在配置文件中配置kafka的依赖,和另一个服务器上配置的一 ...

  4. 命令消费kafka报错(id: -1 rack: null) disconnected

    CDP 717环境使用kafka-console-consumer 命令消费kafka报错如下 23/03/28 09:19:07 WARN clients.NetworkClient: [Consu ...

  5. flume 对接 kafka 报错: Error while fetching metadata with correlation id 35 {=INVALID_TOPIC_EXCEPTION}

    flume 对接 kafka 报错:Error while fetching metadata with correlation id 35 : {=INVALID_TOPIC_EXCEPTION} ...

  6. Kafka Group coordinator xxx:9092 (id: xxx rack: null) is unavailable or invalid

    问题描述: Kafka本身启动和相互通信没有问题,但是在使用Java API 模拟消费者连接到Kafka的时候出现报错 2022-03-03 09:31:22[Consumer clientId=co ...

  7. 【Kafka】kafka 卡死 Discovered coordinator xx:9092 (id: xxx rack: null) for group xxx

    文章目录 1.背景 1.背景 构建了一个kafka消费组,然后主要是想获取kafka的partition的开始offset 和结束的offset,但是获取的时候这里再某些环境下这里卡死了. 程序如下 ...

  8. Spark消费kafka任务卡死:Marking the coordinator xxx:9092 (id: 2147483647 rack: null) dead for group xxx

    1.背景 2. 问题出现 运行了一个spark任务,然后,发现有一个Job特别的慢,其他的最多用了30分钟,但是这个任务却运行了 1.1个小时,数据量是100万的数据. 2.1 任务 点击进入 2.2 ...

  9. kafka报错:creating broker listeners from xxx unable to parse xxx:9092 to a broker endpoint

    1.美图 2.背景 kafka报错:creating broker listeners from xxx unable to parse xxx:9092 to a broker endpoint 具 ...

最新文章

  1. pandas对象保存到mysql出错提示“BLOB/TEXT column used in key specification without a key length”解决办法
  2. boost的chrono模块运行时解析的测试程序
  3. redis的各种数据集的列举功能
  4. python与正则表达式(part2)--正则表达式的转义
  5. python 根据索引取值_Python基础知识2
  6. python实战1.1——根据1.0做词云图
  7. Facebook究竟是怎么抄袭Snapchat的?听听他们自己怎么说
  8. CentOS搭建Git服务器
  9. abb机器人指令手册_ABB机器人CCLink 配置
  10. Combating the Repatriation Blues
  11. 我对平均值,期望,大数定律之间的联系的理解
  12. errorcode 微信分享_微信公众号网页授权code问题
  13. 群晖NAS搭建portainer
  14. CSS中cursor的属性hander和pointer
  15. 分享一个直接加QQ好友的链接或会话的
  16. 数据库——数据库的创建
  17. Windows下Jrtplib的使用
  18. 大学计算机考试美国,美国TOP20计算机专业大学申请建议
  19. 菜狗杯Misc抽象画wp
  20. OpenAtom OpenHarmony分论坛圆满举办,生态与产业发展迈向新征程

热门文章

  1. pandorabox php,PandoraBox和openwrt下的wifidog安装及web认证界面设置
  2. HTML 和 CSS 笔记
  3. 美国人常说的地道口语
  4. MQ-5 气体传感器对接巴法云发送微信消息
  5. 基于情感词典的情感分析
  6. GSM网络的工作频段
  7. 《QQ西游》,最接近神的一个
  8. Python计算两日期之间排除节假日与非上班时间的工作时间
  9. XBMC如何删除一个插件
  10. 春来我不先开口,那个虫儿敢作声