继续超短流水账一篇。

今天午饭时间,一个向来非常稳定的Flink on YARN任务忽然持续报警。查看TaskManager日志均没有问题,但JobManager日志内报出大量Connection reset by peer信息,其中更夹杂着奇怪的错误,如下图所示。

但是作业是一直正常运行的。根据日志,可以凭直觉推测JobManager的REST endpoint出了问题(遭到了RST攻击?)

登录到JM container所在的机器,通过netstatlsof命令找出其PID和监听的端口,发现端口号是4347。然后用tcpdump命令抓包:

tcpdump -i eth0 tcp port 4347 -XX -vv >> dump.out

抓出的一部分报文如下:

12:17:59.434870 IP (tos 0x0, ttl 61, id 34630, offset 0, flags [DF], proto TCP (6), length 60)172.16.200.34.36762 > ec-bigdata-flink-worker-040.lansurveyor: Flags [S], cksum 0xaa12 (correct), seq 611029849, win 64240, options [mss 1460,sackOK,TS val 285643676 ecr 0,nop,wscale 7], length 00x0000:  0016 3e34 f380 eeff ffff ffff 0800 4500  ..>4..........E.0x0010:  003c 8746 4000 3d06 1076 ac10 c822 0a00  .<.F@.=..v..."..0x0020:  27cd 8f9a 10fb 246b 9359 0000 0000 a002  '.....$k.Y......0x0030:  faf0 aa12 0000 0204 05b4 0402 080a 1106  ................0x0040:  939c 0000 0000 0103 0307                 ..........
12:17:59.434890 IP (tos 0x0, ttl 64, id 0, offset 0, flags [DF], proto TCP (6), length 60)ec-bigdata-flink-worker-040.lansurveyor > 172.16.200.34.36762: Flags [S.], cksum 0xa62e (incorrect -> 0x3998), seq 2375752204, ack 611029850, win 28960, options [mss 1460,sackOK,TS val 3208549201 ecr 285643676,nop,wscale 9], length 00x0000:  eeff ffff ffff 0016 3e34 f380 0800 4500  ........>4....E.0x0010:  003c 0000 4000 4006 94bc 0a00 27cd ac10  .<..@.@.....'...0x0020:  c822 10fb 8f9a 8d9b 1a0c 246b 935a a012  ."........$k.Z..0x0030:  7120 a62e 0000 0204 05b4 0402 080a bf3e  q..............>0x0040:  9351 1106 939c 0103 0309                 .Q........
12:17:59.440022 IP (tos 0x0, ttl 61, id 34631, offset 0, flags [DF], proto TCP (6), length 52)172.16.200.34.36762 > ec-bigdata-flink-worker-040.lansurveyor: Flags [.], cksum 0xd78b (correct), seq 1, ack 1, win 502, options [nop,nop,TS val 285643681 ecr 3208549201], length 00x0000:  0016 3e34 f380 eeff ffff ffff 0800 4500  ..>4..........E.0x0010:  0034 8747 4000 3d06 107d ac10 c822 0a00  .4.G@.=..}..."..0x0020:  27cd 8f9a 10fb 246b 935a 8d9b 1a0d 8010  '.....$k.Z......0x0030:  01f6 d78b 0000 0101 080a 1106 93a1 bf3e  ...............>0x0040:  9351                                     .Q
12:17:59.448889 IP (tos 0x0, ttl 61, id 34632, offset 0, flags [DF], proto TCP (6), length 431)172.16.200.34.36762 > ec-bigdata-flink-worker-040.lansurveyor: Flags [P.], cksum 0xa379 (correct), seq 1:380, ack 1, win 502, options [nop,nop,TS val 285643690 ecr 3208549201], length 3790x0000:  0016 3e34 f380 eeff ffff ffff 0800 4500  ..>4..........E.0x0010:  01af 8748 4000 3d06 0f01 ac10 c822 0a00  ...H@.=......"..0x0020:  27cd 8f9a 10fb 246b 935a 8d9b 1a0d 8018  '.....$k.Z......0x0030:  01f6 a379 0000 0101 080a 1106 93aa bf3e  ...y...........>0x0040:  9351 4745 5420 2f63 6769 2d62 696e 2f63  .QGET./cgi-bin/c0x0050:  6f69 6e5f 696e 636c 7564 6573 2f63 6f6e  oin_includes/con0x0060:  7374 616e 7473 2e70 6870 3f5f 4343 4647  stants.php?_CCFG0x0070:  5b5f 504b 475f 5041 5448 5f49 4e43 4c5d  [_PKG_PATH_INCL]0x0080:  3d2f 6574 632f 7061 7373 7764 2530 3020  =/etc/passwd%00.0x0090:  4854 5450 2f31 2e31 0d0a 486f 7374 3a20  HTTP/1.1..Host:.0x00a0:  3130 2e30 2e33 392e 3230 353a 3433 3437  10.0.19.105:43470x00b0:  0d0a 4163 6365 7074 2d43 6861 7273 6574  ..Accept-Charset0x00c0:  3a20 6973 6f2d 3838 3539 2d31 2c75 7466  :.iso-8859-1,utf0x00d0:  2d38 3b71 3d30 2e39 2c2a 3b71 3d30 2e31  -8;q=0.9,*;q=0.10x00e0:  0d0a 4163 6365 7074 2d4c 616e 6775 6167  ..Accept-Languag0x00f0:  653a 2065 6e0d 0a43 6f6e 6e65 6374 696f  e:.en..Connectio0x0100:  6e3a 204b 6565 702d 416c 6976 650d 0a55  n:.Keep-Alive..U0x0110:  7365 722d 4167 656e 743a 204d 6f7a 696c  ser-Agent:.Mozil0x0120:  6c61 2f34 2e30 2028 636f 6d70 6174 6962  la/4.0.(compatib0x0130:  6c65 3b20 4d53 4945 2038 2e30 3b20 5769  le;.MSIE.8.0;.Wi0x0140:  6e64 6f77 7320 4e54 2035 2e31 3b20 5472  ndows.NT.5.1;.Tr0x0150:  6964 656e 742f 342e 3029 0d0a 5072 6167  ident/4.0)..Prag0x0160:  6d61 3a20 6e6f 2d63 6163 6865 0d0a 4163  ma:.no-cache..Ac0x0170:  6365 7074 3a20 696d 6167 652f 6769 662c  cept:.image/gif,0x0180:  2069 6d61 6765 2f78 2d78 6269 746d 6170  .image/x-xbitmap0x0190:  2c20 696d 6167 652f 6a70 6567 2c20 696d  ,.image/jpeg,.im0x01a0:  6167 652f 706a 7065 672c 2069 6d61 6765  age/pjpeg,.image0x01b0:  2f70 6e67 2c20 2a2f 2a0d 0a0d 0a         /png,.*/*....
12:17:59.448904 IP (tos 0x0, ttl 64, id 35162, offset 0, flags [DF], proto TCP (6), length 52)ec-bigdata-flink-worker-040.lansurveyor > 172.16.200.34.36762: Flags [.], cksum 0xa626 (incorrect -> 0xd7b4), seq 1, ack 380, win 59, options [nop,nop,TS val 3208549215 ecr 285643690], length 00x0000:  eeff ffff ffff 0016 3e34 f380 0800 4500  ........>4....E.0x0010:  0034 895a 4000 4006 0b6a 0a00 27cd ac10  .4.Z@.@..j..'...0x0020:  c822 10fb 8f9a 8d9b 1a0d 246b 94d5 8010  ."........$k....0x0030:  003b a626 0000 0101 080a bf3e 935f 1106  .;.&.......>._..0x0040:  93aa                                     ..
12:17:59.449337 IP (tos 0x0, ttl 64, id 35163, offset 0, flags [DF], proto TCP (6), length 251)ec-bigdata-flink-worker-040.lansurveyor > 172.16.200.34.36762: Flags [P.], cksum 0xa6ed (incorrect -> 0x438a), seq 1:200, ack 380, win 59, options [nop,nop,TS val 3208549216 ecr 285643690], length 1990x0000:  eeff ffff ffff 0016 3e34 f380 0800 4500  ........>4....E.0x0010:  00fb 895b 4000 4006 0aa2 0a00 27cd ac10  ...[@.@.....'...0x0020:  c822 10fb 8f9a 8d9b 1a0d 246b 94d5 8018  ."........$k....0x0030:  003b a6ed 0000 0101 080a bf3e 9360 1106  .;.........>.`..0x0040:  93aa 4854 5450 2f31 2e31 2034 3034 204e  ..HTTP/1.1.404.N0x0050:  6f74 2046 6f75 6e64 0d0a 436f 6e74 656e  ot.Found..Conten0x0060:  742d 5479 7065 3a20 6170 706c 6963 6174  t-Type:.applicat0x0070:  696f 6e2f 6a73 6f6e 3b20 6368 6172 7365  ion/json;.charse0x0080:  743d 5554 462d 380d 0a43 6f6e 6e65 6374  t=UTF-8..Connect0x0090:  696f 6e3a 206b 6565 702d 616c 6976 650d  ion:.keep-alive.0x00a0:  0a63 6f6e 7465 6e74 2d6c 656e 6774 683a  .content-length:0x00b0:  2038 320d 0a0d 0a7b 2265 7272 6f72 7322  .82....{"errors"0x00c0:  3a5b 2255 6e61 626c 6520 746f 206c 6f61  :["Unable.to.loa0x00d0:  6420 7265 7175 6573 7465 6420 6669 6c65  d.requested.file0x00e0:  202f 6367 692d 6269 6e2f 636f 696e 5f69  ./cgi-bin/coin_i0x00f0:  6e63 6c75 6465 732f 636f 6e73 7461 6e74  ncludes/constant0x0100:  732e 7068 702e 225d 7d                   s.php."]}
12:17:59.454755 IP (tos 0x0, ttl 61, id 34633, offset 0, flags [DF], proto TCP (6), length 52)172.16.200.34.36762 > ec-bigdata-flink-worker-040.lansurveyor: Flags [.], cksum 0xd52c (correct), seq 380, ack 200, win 501, options [nop,nop,TS val 285643696 ecr 3208549216], length 00x0000:  0016 3e34 f380 eeff ffff ffff 0800 4500  ..>4..........E.0x0010:  0034 8749 4000 3d06 107b ac10 c822 0a00  .4.I@.=..{..."..0x0020:  27cd 8f9a 10fb 246b 94d5 8d9b 1ad4 8010  '.....$k........0x0030:  01f5 d52c 0000 0101 080a 1106 93b0 bf3e  ...,...........>0x0040:  9360                                     .`
12:17:59.454924 IP (tos 0x0, ttl 61, id 34634, offset 0, flags [DF], proto TCP (6), length 52)172.16.200.34.36762 > ec-bigdata-flink-worker-040.lansurveyor: Flags [R.], cksum 0xd528 (correct), seq 380, ack 200, win 501, options [nop,nop,TS val 285643696 ecr 3208549216], length 00x0000:  0016 3e34 f380 eeff ffff ffff 0800 4500  ..>4..........E.0x0010:  0034 874a 4000 3d06 107a ac10 c822 0a00  .4.J@.=..z..."..0x0020:  27cd 8f9a 10fb 246b 94d5 8d9b 1ad4 8014  '.....$k........0x0030:  01f5 d528 0000 0101 080a 1106 93b0 bf3e  ...(...........>0x0040:  9360                                     .`

以上是一个完整的循环,即“握手→互相Push消息→连接重置”(并且对方还试图请求非常敏感的数据,如/etc/passwd),所以短时间内爆出大量"Connection reset by peer"也就是不足为奇了。后来兜兜转转找到安全部门,得知他们正在进行漏洞扫描,而4347恰好是LAN Surveyor工具默认使用的端口,虚惊一场 = =

为了彻底解决问题,我们可以指定高可用JobManager的端口范围,排除掉大部分的注册端口。在flink-conf.yaml中设置:

high-availability.jobmanager.port: 35000-49150

今天帝都持续降雨,天气不好,还是早点回去吧。

民那晚安。


http://www.taodudu.cc/news/show-2933268.html

相关文章:

  • WooCommerce API Keys的生成和保存机制
  • 如何判断一个文件的编码格式是gb2312还是gbk等
  • 蚂蚁开放联盟链合约开发入门
  • Spring boot Shiro 用户认证
  • python实现地理位置类数据爬取与geohash应用初探
  • Java 10正式发布,带来了这些新特性
  • 用Ruby替代Java做rest接口的单元测试!
  • RISC-V Linux 启动流程分析
  • JMeter - REST API测试 - 完整的数据驱动方法(翻译)
  • JMETER进行REST API测试(分步指南)
  • 使用JMETER进行REST API测试(分步指南)
  • 使用JMETER进行REST API测试
  • Orthanc的REST API — Orthanc Book文档
  • JMeter - 如何测试REST API / 微服务
  • 测试REST Web服务
  • 读书笔记-高调做事低调做人 把握好度
  • 无论创业还是做人,你都需要知道什么是MVPPMF
  • 做人要做实在人 作文要作实在文
  • 一个有趣的 5 X 5 方阵一笔画问题
  • 中国大学MOOC大学生心理健康试题及答案
  • 合肥工业大学2020-2021学年《数据挖掘》实验报告(Python实现)
  • 计算机里没有四款小游戏,电脑里一些隐藏在程序里有趣的小游戏
  • 五·C语言之·操作符这么有趣的嘛?
  • C/C++趣味程序百例
  • 学习必备的50条非常有趣且实用的Python一行代码,值得收藏
  • C语言趣味程序设计编程百例精解
  • 大规模SNS中兴趣圈子的自动挖掘
  • 小红书怎么点击查看大图_小红书图片如何调整呢?
  • C/C++趣味编程经典100例详解
  • 程序员的算法趣题Q67: 不挨着坐是一种礼节吗?

Flink JobManager占用注册端口引起的小问题相关推荐

  1. 工业交换机单纤或双纤都只是占用一个端口吗?

    相信很多朋友在购买工业交换机的时候,都会考虑使用现场的传输距离,然后再选择单模还是多模,是单纤还是双纤,那么,这个是占用一个端口的吗?接下来我们就跟随飞畅科技的小编一起来详细了解下吧! 首先在购买的时 ...

  2. 【Flink】 Flink JobManager HA 机制的扩展与实现

    1.概述 转载:Flink 源码阅读笔记(21)- Flink JobManager HA 机制的扩展与实现 在 Flink 1.12 中,Flink on Kubernetes 的 Native 部 ...

  3. Nginx的简单使用,配置多前端,多端口【微信小程序+前后端分离跨域解决】

    微信小程序 微信小程序需要服务器要有域名,不能有端口,但是我还有一个WebSocket的wss协议路径需要填,都是后台的 示例配置文件,配置https转发http,配置https转发wss user ...

  4. 占用80端口的几种情况及解决方法

    首先,我们要看怎么80端口是否被占用: 点击电脑左下角的 输入cmd , 回车,然后输入netstat -ano|findstr "80"  然后回车(注意,-ano后面是一个竖杠 ...

  5. linux查看端口被占用且释放,Linux查看端口占用情况,并强制释放占用的端口

    1.查找被占用的端口 netstat -tln netstat -tln | grep 8080 netstat -tln 查看端口使用情况,而netstat -tln | grep 8080则是只查 ...

  6. 安装tomcat时,SYSTEM进程(PID=4)占用80端口的几种情况及解决方法(window7系统)...

    首先,我们要看怎么80端口是否被占用: 点击电脑左下角的 输入cmd , 回车,然后输入netstat -ano|findstr "80"  然后回车(注意,-ano后面是一个竖杠 ...

  7. window系统80端口被占用 ,解除了NT Kernel System PID=4 进程占用80端口

    window系统80端口被占用问题排查 tomcat 配置的80端口 ,启动时报错80端口 冲突 我这边window 虚拟机服务器是运维人员新配置的,80冲突,然后我把java程序都关闭,已查到不到j ...

  8. mysql服务占用哪个端口,MySQL服务 器默认占用的端口是3306。

    MySQL服务 器默认占用的端口是3306. 更多相关问题 Sunk costs are relevant. 从键盘任意输入一个整数,判断该数能否同时被3.5.7整除,可以输出"yea&qu ...

  9. windows下DOS命令关闭占用的端口

    windows下DOS命令关闭占用的端口 经常,我们在启动应用的时候发现系统需要的端口被别的程序占用,如何知道谁占有了我们需要的端口,很多人都比较头疼,下面就介绍一种非常简单的方法,希望对大家有用. ...

最新文章

  1. binlog流程 mysql_小米 MySQL 数据实时同步到大数据数仓的架构与实践
  2. 使用 Fluentd 和 ElasticSearch Stack 实现 Kubernetes 的集群 Logging
  3. android combobox控件,Android中的组合框
  4. SAP Fiori应用没能从Fiori Launchpad启动的一个可能原因及分析过程
  5. mybatis 添加语句返回对象_mybatis的insert语句插入数据时的返回值的实现
  6. numpy中方法参数axis取值理解
  7. IDC商人应不应该给客户提供服务器测试?```
  8. mybatis缓存学习笔记
  9. 云服务器如何清理垃圾释放空间?
  10. 在SqlMapConfig.xml 中typeAliases与properties的关系
  11. 第一次提交本地代码到github上
  12. XPS文件转换成PDF
  13. 查看Android应用签名信息
  14. 目标检测-ImageAI从安装到使用详解
  15. 5分钟让你明白金融危机爆发原因
  16. 词汇处理——词义辨析消歧(一)
  17. mysql定义过程_mysql定义和调用存储过程
  18. Unity 读取本地文件夹图片
  19. Redis和消息队列
  20. java 给一个开学日期,计算当天是开学第几周星期几或者开学第几周星期几为哪一天

热门文章

  1. 后缀是lnk是什么文件_lnk是什么格式_lnk后缀是什么格式
  2. ChatGPT提示词工程(六):Expanding扩展
  3. datax(10): 源码解读Communication(Datax通讯类)
  4. 北京社保开户需要的手续及流程
  5. 大数据入门--带你快速了解大数据
  6. OpenCV Eigen Sophus PCL G2O
  7. 概论第7章_参数估计_点估计的评价标准_相合性_无偏性_有效性
  8. 电脑桌面加html格式壁纸,巧妙使用IDM获取精美电脑桌面壁纸
  9. win10 程序最小化不在任务栏了?在左下角
  10. 3.7计算机网络(IP数据报格式,IP数据报分片,IPv4)