摘要:如果你的开发过程涉及数据传输,一直在重传、超时之类的方案里有困惑的话,不妨重新学一学可靠性最精致的TCP协议。

本文分享自华为云社区《TCP的慢启动、拥塞避免、重传、快恢复乱七八糟总是记不清?11个连环问让你一次性打通任督二脉》,作者: breakDraw。

TCP的拥塞避免等机制对于初学者来说还是比较复杂的,工作中如果开发时偏应用层,那么大部分时候就会摸不到这个机制,感受也就没那么深了。但如果你的开发过程涉及数据传输,一直在重传、超时之类的方案里有困惑的话,不妨重新学一学可靠性最精致的TCP协议。

所以这里我抛去死记硬背的那堆概念,用10个连续的问题来学习这个机制,注意看的时候先自己思考一下如果是自己,会怎么设计,再去看实际的TCP设计,来理解它的精妙之处。

Q: 建立连接后,每次发送的报文数量是固定的吗?即每次都发1条或者10条?

A:不是。
建立连接后,会先只发1条, 然后发2条,接着再发4条,逐步增加。
这个过程叫 “慢启动”
这个1、2、4递增的数量被称之为 拥塞窗口 cwnd

可以理解为TCP希望刚开始,可以大胆点,不断加数量。但为了保险期间还是从1条还是倍增。

Q: 慢启动过程中,那么发送数量(拥塞窗口)什么时候不再倍增?是无限倍增吗?

A:不会无限倍增。

当到达慢启动门限ssthreshold时,会变成每次都增加1条。
这个过程叫拥塞避免过程, 也有叫他拥塞避免算法的

可以理解为tcp感觉到有风险了,于是开始慢慢地、小心翼翼地1条1条地添加发送条数。

Q:那么,当进入拥塞避免,每次+1时,什么时候才会不再继续加?

A:随着每次发送的数量越发越多, 最终会超出带宽限制,于是就会有某条报文发生超时。

有可能是发的中途丢了, 亦或者是返回的数据全阻塞住了,一条都回不来。

当发送端检测到发生超时时,就会让 慢启动门限ssthreshold = 当前拥塞窗口cwnd/2

接着cwnd 重新置为1,从新开始 慢启动算法。

这样的好处在于可以检测到每次发送的上限,动态调整发送窗口。

上面的过程叫做 超时重传

注意发生超时重传时, cwnd会重置成1。

Q: 上面提到了超时, 那么TCP客户端是怎么判断报文发送超时的呢?

A:每次发送数据包的时候, 都会有一个相应的计时器,一旦超过 RTO(超时时间) 而没有收到 ACK, TCP就会重发该数据包。

没收到 ACK 的数据包都会存在重传缓冲区里,等到 ACK 后,就从缓冲区里删除。

Q:上面提到的超时时间RTO是怎么来的?万一设得太大可能导致很迟才能反应过来, 设得太小则可能导致每条都超时

A:通过“每次报文的往返时间样本”和“之前样本的偏差值”动态计算出来的。

  • RTT : 报文往返时间(指从发送到收到ack的时间)。每个报文发出后都有个定时器,收到后都会计算出一个RTT样本
  • RTTs: 加权平均往返时间,类似于一个估算的往返时间,实时在变。
    RTTs = (1-a) * RTTs + a * RTT最新样本
    即每次得到RTT样本后, 都会使用a这个占比去更新RTTs。
  • RTTd: RTT偏差加权平均值(就是用来计算超时时间应该比RTT多多少)
    RTTd = (1 - b) * RTTd + b*RTTs - RTT最新样本
    即每次会用新的RTTs以b的占比去更新一下RTTd,并减去RTT样本
  • RTO : 超时重传时间
    等于平均往返时间 加上 4倍偏差值
    RTO = RTTs + 4*RTTd

Q: 如果发生重传,却还是没有收到ack,那么最新的RTT样本应该怎么算?即你都收不到最新的ack了, RTT难道取超时时间吗?

A:会使用karn算法: 发生重传时,不更新这次的RTT样。选用后面收到的ack

修正karn: 为了避免发生重传后,实际RTT都变慢了,导致一下子所有请求都超时, 会在发生重传时,把RTO假大1倍。

Q: 上面提到的ACK超时判断会不会太久了? 假如只是发的时候丢了中间部分报文而已, 但大部分报文ACK还能正常返回,也要一直等超时吗?

A:如果能正常接收其他报文的ACK, 只是中间的部分报文丢了, 则有另一个办法。

接收端有一个冗余确认机制:

  1. 发送端A 发送 1、2、3、4、5四条
  2. 但是B接收端只收到1、2、4、5,而3因为网络拥塞丢了。
  3. 于是B会发送ack=3而不是ack=5 给A。 这就是冗余确认机制,只发送缺失那部分的ack,后面的4和5都不管。
  4. A收到ack=3后, 继续发送3、4、5、6、7, 结果3还是丢了。
  5. 于是B又发送ack=3。

当A发现连续3次收到了ack=3时,就会觉察到不对劲,我都发3次了你还是说没收到,可你又能正常返回其他ACK给我,是不是我发的太多了?

上面这个判断3次的重传算法叫“快重传”。

于是A会马上进入 “快速恢复”。

和之前类似,慢启动门限ssthreshold = 当前拥塞窗口cwnd/2。但是!! 新的拥塞窗口cwnd会设置成ssthreshold/2, 而不是1。而且不会走慢启动倍增的那种,而是走拥塞避免, 逐步+1的那种。

Q: 前面“超时重传”的时候,是变成从1开始慢启动, 为什么这个“快重传”却是从ssthreshold/2开始,并且走拥塞避免? 为什么会有这个区别?

A:因为前面发生超时重传时, 是比较严重的情况, 超时时间内一个ACK都没收到。就好像来回数据都凭空消失了。

而快速重传发生时, 还是能收到部分ack的, 只是丢失了部分数据, 说明拥塞没那么严重,于是可以大胆一点将cwnd削减到1/4, 而不是直接从1开始。

其他

到了这里,基本就能理清楚超时重传和快重传的区别了,重点是理解这2个区别是怎么来的。后面再补几个问题,避免你和其他概念搞混,但不会说得太深,具体需要你自己去扩展学习了。

Q: 为啥发送地多了,数据就会部分丢失?这个是怎么个原理?

A:路由器有缓存,IP分组接收过多时就会耗尽空间,丢弃数据。详细可以看路由器的数据转发原理。

Q: TCP除了上面的重传定时器, 好象还有个坚持定时器?区别是啥?

A:坚持定时器和超时、网络拥塞没有关系, 和通告窗口即对端的接收能力有关。

简单来说, 就是对方的传输层缓冲区(接收端窗口)满了,告诉你别发了,我吃不下了,于是返回通告窗口为0。

但你想知道啥时候可以发,于是就启动一个坚持定时器,每隔5s发送1个字节的小报文,小小地试探下。当通告窗口不为0了,就重新开始发。

 点击关注,第一时间了解华为云新鲜技术~

TCP的慢启动、拥塞避免、重传、快恢复乱七八糟总是记不清?11个连环问让你一次性打通任督二脉相关推荐

  1. 【计算机网络】传输层 : TCP 拥塞控制 ( 慢开始 | 拥塞避免 | 快重传 | 快恢复 )

    文章目录 一.TCP 拥塞控制 二.TCP 拥塞控制算法 三.慢开始 和 拥塞避免 算法 四.快重传 和 快回复 算法 一.TCP 拥塞控制 TCP 拥塞控制 : ① 拥塞出现表现 : 资源需求总和 ...

  2. 【计算机网络】-TCP的拥塞控制及拥塞控制方法

    TCP的拥塞控制及拥塞控制方法 TCP的拥塞控制 TCP的拥塞判断 TCP拥塞控制的方法 基于窗口的拥塞控制 拥塞窗口 慢开始 拥塞避免 快重传 快恢复 TCP拥塞控制总体流程图 TCP拥塞控制综合例 ...

  3. TCP的拥塞控制--慢启动,拥塞避免,快重传,快速恢复

    拥塞现象是指到达通信子网中某一部分的分组数量过多,使得该部分网络来不及处理,以致引起这部分乃至整个网络性能下降的现象,严重时甚至会导致网络通信业务陷入停顿,即出现死锁现象.这种现象跟公路网中经常所见的 ...

  4. 5.3.3 计算机网络传输层之TCP拥塞控制(慢开始与拥塞避免、快重传和快恢复)

    文章目录 1.什么是拥塞控制? 2.拥塞控制与流量控制的区别 3.拥塞控制的4种算法 (1)慢开始与拥塞避免 (2)快重传和快恢复 1.什么是拥塞控制? 所谓拥塞控制,是指防止过多的数据注入网络,保证 ...

  5. UDP(首部)和TCP(首部、三次握手、四次挥手、可靠传输、滑动窗口、流量控制、拥塞控制(慢开始、拥塞避免、快重传、快恢复))

    1.UDP 用户数据报协议 UDP(User Datagram Protocol): 是无连接的,尽最大可能交付,没有拥塞控制,面向报文(对于应用程序传下来的报文不合并也不拆分,只是添加 UDP 首部 ...

  6. 网络:TCP停止等待、超时重传、滑动窗口、拥塞控制、快重传和快恢复

    TCP超时与重传机制 TCP协议是一种面向连接的可靠的传输层协议,它保证了数据的可靠传输,对于一些出错,超时丢包等问题TCP设计的超时与重传机制.其基本原理:在发送一个数据之后,就开启一个定时器,若是 ...

  7. TCP之快重传与快恢复

    1.快重传 对于接收方来说,如果接收方收到一个失序的报文段,就立即回送一个 ACK 给发送方 当发送方收到了3个重复的ACK时,则发送方快速重传丢失的包(所谓失序的报文是指,用户没有按照顺序收到TCP ...

  8. 关于慢开始、拥塞控制、快重传、快恢复算法的理解

    门限值(ssthresh):过了门限值就采用拥塞控制算法 拥塞窗口:某时刻能发送多少报文段 超时:一旦发送方发现超时,立刻就调整门限值,为顶峰窗口1/2,然后采用慢开始算法. 收到三个重复ACK:一旦 ...

  9. 27-TCP 协议(快重传与快恢复)

    很遗憾的是,这里一节我没办法用实验演示给你看,但是我尽量用文字和图叙述清楚. 慢启动和拥塞避免算法是在 1988 年提出的,而快重传和快恢复是 1990 年提出的.既然这两个新算法是时隔两年后才提出的 ...

最新文章

  1. python使用正则表达式判别用户输入密码的强弱并提示
  2. ASP.NET常用的26个优化性能方法
  3. mybatis缓存机制
  4. 【机器视觉】 case算子
  5. [leetcode] 105.从前序与中序遍历构造二叉树
  6. node.js Stream Buffer FsPromise
  7. 在N + 1场景中使用@NamedEntityGraph更有选择地加载JPA实体
  8. 《 Docker 进阶与实战 》 读书笔记
  9. TypeScript 3.4 发布
  10. homebrew安装
  11. JZOJ 3427. 归途与征程
  12. 启动多个线程后同时并行执行程序
  13. sql server分页_SQL Server中的分页简介
  14. Linux Tun/Tap网口(/dev/net/tun)的读写方法
  15. 浅谈ThinkPHP(三)
  16. 操作系统 第二部分 进程管理(三)
  17. 【信号与系统|吴大正】2:连续系统的时域分析
  18. Windows安装SSH
  19. 前十大编程语言你会几种?
  20. 解决 XCUITest iproxy exited with code 208

热门文章

  1. Bootstrap列表组支持的组件
  2. Bootstrap按钮组嵌套
  3. SLAM Cartographer(6)传感器桥梁
  4. ROS笔记(12) Rviz
  5. mysql+安全性语言实验,实验四--数据库的安全性、完整性控制
  6. centos 对某ip开放 防火墙端口_CentOS操作系统防火墙Firewalld记录日志及用途
  7. python websocket异步高并发_python – WebSocket聊天异步示例崩溃
  8. c语言malloc和直接声明,问下关于malloc的声明问题
  9. Oracle DBA 经典面试题
  10. 【转】HBase原理和设计