在服务器的日常维护过程中,会经常用到下面的命令:

netstat -n | awk ‘/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}’

其中$NF表示最后一个字段

它会显示例如下面的信息:

TIME_WAIT 814

CLOSE_WAIT 1

FIN_WAIT1 1

ESTABLISHED 634

SYN_RECV 2

LAST_ACK 1

常用的三个状态是:ESTABLISHED 表示正在通信,TIME_WAIT 表示主动关闭,CLOSE_WAIT 表示被动关闭。

再具体一点,四次挥手的交互过程如下:

客户端先发送FIN,进入FIN_WAIT1状态

服务端收到FIN,发送ACK,进入CLOSE_WAIT状态,客户端收到这个ACK,进入FIN_WAIT2状态

服务端发送FIN,进入LAST_ACK状态

客户端收到FIN,发送ACK,进入TIME_WAIT状态,服务端收到ACK,进入CLOSE状态

客户端TIME_WAIT持续2倍MSL时长,在linux体系中大概是60s,转换成CLOSE状态

能不能发送完ACK之后不进入TIME_WAIT就直接进入CLOSE状态呢?不行的,这个是为了TCP协议的可靠性,由于网络原因,ACK可能会发送失败,那么这个时候,被动一方会主动重新发送一次FIN,这个时候如果主动方在TIME_WAIT状态,则还会再发送一次ACK,从而保证可靠性。那么从这个解释来说,2MSL的时长设定是可以理解的,MSL是报文最大生存时间,如果重新发送,一个FIN+一个ACK,再加上不定期的延迟时间,大致是在2MSL的范围。

如果服务器出了异常,百分之八九十都是下面两种情况:

1.服务器保持了大量TIME_WAIT状态

2.服务器保持了大量CLOSE_WAIT状态

因为linux分配给一个用户的文件句柄是有限的,而TIME_WAIT和CLOSE_WAIT两种状态如果一直被保持,那么意味着对应数目的通道就一直被占着,一旦达到句柄数上限,新的请求就无法被处理了,接着应用程序可能返回大量Too Many Open Files异常。

1)服务端的Time-wait过多

先来说一说长连接和短连接,在HTTP1.1协议中,有个 Connection 头,Connection有两个值,close和keep-alive,这个头就相当于客户端告诉服务端,服务端你执行完成请求之后,是关闭连接还是保持连接。如果服务器使用的短连接,那么每次客户端请求后,服务器都会主动发送FIN关闭连接。最后进入time_wait状态。可想而知,对于访问量大的Web Server,会存在大量的TIME_WAIT状态。让服务器能够快速回收和重用那些TIME_WAIT的资源,可以修改内核参数。

修改/etc/sysctl.conf如下:

#对于一个新建连接,内核要发送多少个 SYN 连接请求才决定放弃,不应该大于255,默认值是5,对应于180秒左右时间

net.ipv4.tcp_syn_retries=2

#net.ipv4.tcp_synack_retries=2

#表示当keepalive起用的时候,TCP发送keepalive消息的频度。缺省是2小时,改为300秒

net.ipv4.tcp_keepalive_time=1200

net.ipv4.tcp_orphan_retries=3

#表示如果套接字由本端要求关闭,这个参数决定了它保持在FIN-WAIT-2状态的时间

net.ipv4.tcp_fin_timeout=30

#表示SYN队列的长度,默认为1024,加大队列长度为8192,可以容纳更多等待连接的网络连接数。

net.ipv4.tcp_max_syn_backlog = 4096

#表示开启SYN Cookies。当出现SYN等待队列溢出时,启用cookies来处理,可防范少量SYN攻击,默认为0,表示关闭

net.ipv4.tcp_syncookies = 1

#表示开启重用。允许将TIME-WAIT sockets重新用于新的TCP连接,默认为0,表示关闭

net.ipv4.tcp_tw_reuse = 1

#表示开启TCP连接中TIME-WAIT sockets的快速回收,默认为0,表示关闭

net.ipv4.tcp_tw_recycle = 1

##减少超时前的探测次数

net.ipv4.tcp_keepalive_probes=5

##优化网络设备接收队列

net.core.netdev_max_backlog=3000

修改完之后执行/sbin/sysctl -p让参数生效。

2)close_wait

如果一直保持在CLOSE_WAIT状态,那么只有一种情况,就是在对方关闭连接之后服务器程序自己没有进一步发出FIN信号,一般原因都是TCP连接没有调用关闭方法。换句话说,就是在对方连接关闭之后,程序里没有检测到,或者程序压根就忘记了这个时候需要关闭连接,于是这个资源就一直被程序占着。这种情况,通过服务器内核参数也没办法解决,服务器对于程序抢占的资源没有主动回收的权利,除非终止程序运行,一定程度上,可以使用TCP的KeepAlive功能,让操作系统替我们自动清理掉CLOSE_WAIT连接。

但是实际上,还是主要是因为我们的程序代码有问题,通常是如下问题:

当对方调用closesocket的时候,你的程序正在

C代码

int nRet = recv(s,….);

if (nRet == SOCKET_ERROR)

{

// closesocket(s);

return FALSE;

}    很多人就是忘记了那句closesocket

当主动关闭的一方发送FIN到被动关闭这边后,被动关闭这边的 TCP马上回应一个ACK过去,同时向上面应用程序提交一个ERROR,

导致上面的SOCKET的send或者recv返回SOCKET_ERROR,正常情况下,如果上面在返回SOCKET_ERROR后调用了 closesocket,那么被动关闭的者一方的TCP就会发送一个FIN过去,自己的状态就变迁到LAST_ACK。

java timewait_time_wait和close_wait产生原因及解决相关推荐

  1. 服务器大量TIME_WAIT和CLOSE_WAIT的原因及解决办法

    原文:https://www.cnblogs.com/whx7762/p/9413787.html 今天登陆服务器想查看一个端口的占用情况,发现好多TIME_WAIT的情况,吓我一跳. 如下是TCP ...

  2. 网络 TCP的头部 3次握手和4次挥手 出现大量TIME_WAIT或CLOSE_WAIT的原因及解决办法

    TCP头部结构 16位源端口:标识发送方端口 16位目的端口:标识接受方端口 32位序列号:数据按照序列号传输,如果接收方接受后的数据序列号出现错误,可以根据此序号重新排列 32位确认号:接受方接受到 ...

  3. 出现 java.lang.UnsupportedClassVersionError 错误的原因及解决方法

    1 错误描述 正常运行程序,报出如下错误: 2 错误原因 通过观察上述标记出来的错误描述,咱们可以知道: java.lang.UnsupportedClassVersionError:Unsuppor ...

  4. java defunct_java defunct产生的原因和解决办法

    java defunct产生的原因和解决办法: 在很多时候,我们启动JAVA进程后,如果退出这个JAVA进程,在系统进程中仍然可以看到这个进程. 这种情况一般出现在UNIX/linux系统,对于WIN ...

  5. Java中死锁产生的原因及解决方法

    一.什么是死锁 死锁就是指两个或两个以上的线程在执行过程中,由于竞争资源或者由于彼此通信而造成的现象,若无外力作用,他们都无法推进下去. 简单来说就是A和B若同时都有一个资源,在此之外还想拥有对方的资 ...

  6. java面试-内存溢出的原因及解决办法

    内存溢出是指应用系统中存在无法回收的内存或使用的内存过多,最终使得程序运行要用到的内存大于虚拟机能提供的最大内存. 引起内存溢出的原因有很多种,常见的有以下几种: 1.内存中加载的数据量过于庞大,如一 ...

  7. 出现 org.apache.tomcat.xxx.ClassFormatException: Invalid byte tag in constant pool: 15 异常的原因及解决方法

    1 异常描述 最近,当我从 SVN 检出项目并正常配置完 Tomcat 之后,启动项目,总是报出如下异常: 2 异常原因 通过观察上述标记出来的异常描述,我们可以知道: org.apache.tomc ...

  8. com/opensymphony/xwork2/spring/SpringObjectFactory.java:220:-1问题出现的原因及解决办法

    转自:https://blog.csdn.net/shinchan_/article/details/37818927 com/opensymphony/xwork2/spring/SpringObj ...

  9. java.util.ConcurrentModificationException异常原因及解决方法

    java.util.ConcurrentModificationException异常原因及解决方法 参考文章: (1)java.util.ConcurrentModificationExceptio ...

最新文章

  1. 无连接的用户数据报协议UDP
  2. python文件操作和集合(三)
  3. Python zmq的三种简单模式
  4. C# 使用new 关键字显式隐藏从基类继承的成员和内部类的使用
  5. Android研究-linux内核启动到android系统
  6. 页面间参数值传递含“%”的处理方法
  7. SAP Spartacus Route Alias
  8. 每天一个linux命令(1):ln 命令
  9. 三、数据预处理——处理分类型数据:编码与哑变量
  10. 09年3月编程语言排行榜:Visual Basic与PHP的暗战
  11. php微信个性化菜单,微信公众平台新增个性化菜单接口,实现公众号
  12. Android Studio(7)---查找例子
  13. 小波说雨燕 第三季 构建 swift UI 之 度假清单 学习笔记
  14. 消防信号总线原理_消防安全微视频:可燃气体探测报警系统培训
  15. spring-session(一)揭秘续篇
  16. NanoMsg框架|C#中Nanomsg的PAIR和BUS使用
  17. 关于把Excel转换成word的经验
  18. 微信小程序实现带参数的分享功能
  19. 【日常训练赛】C - Prove Him Wrong
  20. 微积分学习笔记(2)--修改更新中

热门文章

  1. Manjaro KDE 18.1.2踩坑指南(含双显卡黑屏解决方案)
  2. 2022年中国企业500强研究报告
  3. iphonese左滑返回_2020年最热门的7种iPhone SE替代产品,您一定会感到惊讶!!! 加上Google Pixel 4a的对比。
  4. 将mysql数据库拷贝到另一台机器_mysql数据库迁移到另一台电脑上
  5. github+hexo搭建个人博客
  6. 【Python】图片处理
  7. HDU 1506 解题报告 Largest Rectangle in a Histogram (单调栈)
  8. php中的echo单引号_PHP echo用法详解
  9. 【我的OpenGL学习进阶之旅】计算机视觉 (CV) 、 计算机图形学 (CG) 以及图像处理(DIP)
  10. DAY23:命令执行代码执行漏洞