传输层的重要协议——TCP
传输层上的两个重要协议
UDP:用户报文协议
TCP:传输控制协议
相同点:都是传输层协议,都需要实现进程to进程的通信
差异点:UDP没有做任何处理,保持网络原生态(不可靠)
TCP做了一定的传输控制,是的通信变得可靠
UDP:不可靠,无连接,面向数据报文的一种协议
TCP:可靠,有连接、面向字节流的一种协议(站在应用层视角)
网络层主要是IP协议
网络层(IP)上一个重要的概念:IP地址 127.0.0.1(本机环回地址),代表“本机”
传输层(TCP/UDP)上的重要概念:端口(port)0 - 65535的一个16位无符号整数
端口:进程之间的联系 一个端口只能属于一个进程/一个进程可以拥有多个端口
IP地址(双方) + 端口(双方) + 传输层协议 = 五元组信息
通过五元组可以唯一确定网络上的一条通信线路
套接字(Socket)
站在应用层,做网络编程很重要的概念。
类似插口,应用层以下都是由OS + 硬件提供的,应用层要享受OS提供的网络服务,需要通过OS提供的服务窗口(Socket)来享受服务
网络部分的代码经常不知道走到哪停止了,有两种方法:
调试 和 增加日志(就是打印,多添加一个当前时间的打印)
class LocalDataTime 本地日期时间
Date:日期 年月日
Time:时间 时分秒
重要协议
TCP、UDP、IP协议
应用层:DNS、HTTP、HTTPS
传输层:UDP、TCP 在主机可以和主机通信的前提下,让进程可以和进程通信
网络层:IP 在LAN内部主机可以和主机通信的前提下,实现跨LAN主机to主机通信
数据链路层:ARP 在物理介质连通的前提下,实现LAN 主机 to 主机通信
物理层 纯物理介质通讯问题
传输层 TCP
目标:process to process;保证可靠性,不是保证安全性
TCP协议段格式
源/目的端口号:表示数据是从哪个进程来,到哪个进程去;
32位序号/32位确认号:后面详细讲;
4位TCP报头长度:表示该TCP头部有多少个32位bit(有多少个4字节);所以TCP头部最大长度是
15 * 4 = 60
6位标志位:
URG:紧急指针是否有效
ACK:确认号是否有效
PSH:提示接收端应用程序立刻从TCP缓冲区把数据读走
RST:对方要求重新建立连接;我们把携带RST标识的称为复位报文段
SYN:请求建立连接;我们把携带SYN标识的称为同步报文段
FIN:通知对方,本端要关闭了,我们称携带FIN标识的为结束报文段
16位窗口大小:后面再说
16位校验和:发送端填充,CRC校验。接收端校验不通过,则认为数据有问题。此处的检验和不光
包含TCP首部,也包含TCP数据部分。
16位紧急指针:标识哪部分数据是紧急数据;
40字节头部选项:暂时忽略;
TCP原理
TCP对数据传输提供的管控机制,主要体现在两个方面:安全和效率。
这些机制和多线程的设计原则类似:保证数据传输安全的前提下,尽可能的提高传输效率。
确认应答机制
TCP将每个字节的数据都进行了编号。即为序列号。
每一个ACK都带有对应的确认序列号,意思是告诉发送者,我已经收到了哪些数据;下一次你从哪里开
始发。
超时重传机制
主机A发送数据给B之后,可能因为网络拥堵等原因,数据无法到达主机B;
如果主机A在一个特定时间间隔内没有收到B发来的确认应答,就会进行重发;
但是,主机A未收到B发来的确认应答,也可能是因为ACK丢失了;
因此主机B会收到很多重复数据。那么TCP协议需要能够识别出那些包是重复的包,并且把重复的丢弃
掉。
这时候我们可以利用前面提到的序列号,就可以很容易做到去重的效果。
那么,如果超时的时间如何确定?
最理想的情况下,找到一个最小的时间,保证 “确认应答一定能在这个时间内返回”。
但是这个时间的长短,随着网络环境的不同,是有差异的。
如果超时时间设的太长,会影响整体的重传效率;
如果超时时间设的太短,有可能会频繁发送重复的包;
TCP为了保证无论在任何环境下都能比较高性能的通信,因此会动态计算这个最大超时时间。
Linux中(BSD Unix和Windows也是如此),超时以500ms为一个单位进行控制,每次判定
超时重发的超时时间都是500ms的整数倍。
如果重发一次之后,仍然得不到应答,等待 2*500ms 后再进行重传。
如果仍然得不到应答,等待 4*500ms 进行重传。依次类推,以指数形式递增。
累计到一定的重传次数,TCP认为网络或者对端主机出现异常,强制关闭连接。
连接管理机制
在正常情况下,TCP要经过三次握手建立连接,四次挥手断开连接
较粗的虚线表示服务端的状态变化情况;
较粗的实线表示客户端的状态变化情况;
CLOSED是一个假想的起始点,不是真实状态;
三次握手:
- 为什么要有握手阶段(同步阶段):为了可靠性,确保对方在线 && 需要给对方一些基本信息
- 为什么标志位叫做syn:是同步synchronize的缩写
- 为什么是三次握手:逻辑上是四次,合并为三次,第二次的syn和ack是同步发送的。
- 三次握手过程中的双方:主动连接方、被动连接方
- 三次握手过程中的标志位变化:syn\syn + ack\ack
- 三次握手过程中携带数据情况:不能、不能、允许
- 三次握手过程中的SN/ASN变化:a 0 / b a + 1 / a + 1 b + 1
- 三次握手过程中双方的状态变化过程:
- 为什么要有状态
- 学会阅读状态转移图
- 状态变化和外部事件的关系
四次挥手:
CLOSE_WAIT状态发生在被动方,出现的情况是:单方面”分手“(对方请求断开连接,我还没断开连接。
现象:服务器上出现大量的CLOSE_WAIT状态的TCP连接,请问这种现象是否合理?如果合理,说明理由?
答案:不确定是否合理,单纯这个现象无法断言是否是正常的。
因为如果我们的程序设计时,会出现比较长时间的单方面关闭的情况时,出现大量CLOSE_WAIT是合理现象。
但如果我们没有这种设计,则不合理,可能的原因是我们这一侧忘记调用socket.close()
TIME_WAIT状态发生在主动方,出现的情况是挥手已经结束了。
为什么挥手结束了还要有这个状态时间而不是直接进入CLOSE状态?
因为有两个原因:
- 不保证被动挥手方能收到最后一个ack,如果对面没收到,被动挥手方需要重发fin,为了避免不知道收到fin是怎么回事,所以不能直接释放连接。
- 如果不经过TIME_WAIT的时间直接释放,会被五元组立即分配出去,但是如果此时收到了一个数据,可能是之间网络传输比较满的数据刚到,无法确定是谁的。
为什么TIME_WAIT时间是2MSL?
MSL代表一个Segment能在网上活着的最大时间。
2*MSL时间过去之后,一个来回都够了,
说明:
- 对方一定是最后一个ack(即使对方没有收到,在发送的fin我们也没有收到,说明网络出问题)
- 网络上肯定没有发送给甲的segment了,所以收到的segment一定是给乙的
现象:服务器上有大量的TIME_WAIT状态 TCP连接,是否合理?
理论上来讲,确实是合理的。从标准上来讲,没有任何的问题,我们的代码正常的关闭了连接。但实践上来讲不太合理。
因为维护连接是有成本的(最主要的成本就是内存)
对于客户端和服务器来说,服务器身上的连接有很多,所以,做网络编程设计的时候,不建议服务器去主动关闭连接(特殊情况该主动还是要主动)
对于TCP的异常情况:
如果甲和乙保持连接状态
如果进甲的任务管理器直接杀掉甲进程,连接命运如何?
看起来没执行close,但是进程中所有资源都是OS给的,所以,OS也会走进程序资源释放流程,将TCP连接正常关闭。所以看起来这个连接就是甲为主动关闭,正常四次挥手。
如果重启电脑或点击关机,同样是执行OS的逻辑,还是甲正常四次挥手。
如果直接对甲拔电源,OS作为软件,软件就是程序 + 指令,不能正常执行,所以连接命运需要分开讨论。
甲主机上连接的命运是,俩捏知识逻辑上的概念,表现在实现中,只是内存中的一段数据。电断之后,内存中的数据就没了,连接就突然消失了,不是正常关闭,也不是异常关闭。
乙主机上连接的命运是
如果乙发生了写事件(尝试向甲发送数据)
但是收不到应答,即使超时重传也收不到。多次尝试后,乙走异常关闭流程。
- 关闭该TCP连接。
- 异常的方式通知应用层
- 最后再发一条reset segment
从甲消失到乙断开连接不是瞬时的。
如果乙知识单纯在读数据,乙是无法区分甲是消失了,还是只是没说话。
如果乙一直在read,则乙这条连接就是死链接了(一直保持established状态,但永远收不到数据了)
为了应对上述的情况:
- TCP层面有种keepalive机制:定期发送一些数据给对方(payload长度是0),segment长度不是0就可以根据对方有没有应答来判断。目前应用不多。
- 更常见的办法是应用层自己来做整个工作:
- 应用read的时候,不要无限制的read,而是带上一个超时时间(read timeout)
- 定期互相报平安(定期主动给对方发消息)——heartbeat(心跳包)
滑动窗口
对每一个发送的数据段,都要给一个ACK确认应答。收到ACK后再发送
下一个数据段。这样做有一个比较大的缺点,就是性能较差。尤其是数据往返的时间较长的时候。
既然这样一发一收的方式性能较低,那么我们一次发送多条数据,就可以大大的提高性能(其实是将多
个段的等待时间重叠在一起了)。
窗口大小指的是无需等待确认应答而可以继续发送数据的最大值。上图的窗口大小就是4000
个字节(四个段)。
发送前四个段的时候,不需要等待任何ACK,直接发送;
收到第一个ACK后,滑动窗口向后移动,继续发送第五个段的数据;依次类推;
操作系统内核为了维护这个滑动窗口,需要开辟 发送缓冲区 来记录当前还有哪些数据没有应
答;只有确认应答过的数据,才能从缓冲区删掉;
窗口越大,则网络的吞吐率就越高;
如果出现丢包如何进行重传:
如果是数据包到了,只是ack丢了
这种情况下,部分ACK丢了并不要紧,因为可以通过后续的ACK进行确认
如果是数据包丢了
当某一段报文段丢失之后,发送端会一直收到 1001 这样的ACK,就像是在提醒发送端 “我想
要的是 1001” 一样;
如果发送端主机连续三次收到了同样一个 “1001” 这样的应答,就会将对应的数据 1001 -
2000 重新发送;
这个时候接收端收到了 1001 之后,再次返回的ACK就是7001了(因为2001 - 7000)接收端
其实之前就已经收到了,被放到了接收端操作系统内核的接收缓冲区中;
这种机制被称为 “高速重发控制”(也叫 “快重传”)。
流量控制
接收端处理数据的速度是有限的。如果发送端发的太快,导致接收端的缓冲区被打满,这个时候如果发
送端继续发送,就会造成丢包,继而引起丢包重传等等一系列连锁反应。
因此TCP支持根据接收端的处理能力,来决定发送端的发送速度。这个机制就叫做流量控制(Flow
Control);
接收端将自己可以接收的缓冲区大小放入 TCP 首部中的 “窗口大小” 字段,通过ACK端通知发
送端;
窗口大小字段越大,说明网络的吞吐量越高;
接收端一旦发现自己的缓冲区快满了,就会将窗口大小设置成一个更小的值通知给发送端;
发送端接受到这个窗口之后,就会减慢自己的发送速度;
如果接收端缓冲区满了,就会将窗口置为0;这时发送方不再发送数据,但是需要定期发送一
个窗口探测数据段,使接收端把窗口大小告诉发送端。
接收端如何把窗口大小告诉发送端呢?回忆我们的TCP首部中,有一个16位窗口字段,就是存放了窗口
大小信息;
那么问题来了,16位数字最大表示65535,那么TCP窗口最大就是65535字节么?
实际上,TCP首部40字节选项中还包含了一个窗口扩大因子M,实际窗口大小是 窗口字段的值左移 M
位;
拥塞控制
虽然TCP有了滑动窗口这个大杀器,能够高效可靠的发送大量的数据。但是如果在刚开始阶段就发送大
量的数据,仍然可能引发问题。
因为网络上有很多的计算机,可能当前的网络状态就已经比较拥堵。在不清楚当前网络状态下,贸然发
送大量的数据,是很有可能引起雪上加霜的。
TCP引入 慢启动 机制,先发少量的数据,探探路,摸清当前的网络拥堵状态,再决定按照多大的速度传
输数据;
此处引入一个概念程为拥塞窗口
发送开始的时候,定义拥塞窗口大小为1;
每次收到一个ACK应答,拥塞窗口加1;
每次发送数据包的时候,将拥塞窗口和接收端主机反馈的窗口大小做比较,取较小的值作为
实际发送的窗口;
像上面这样的拥塞窗口增长速度,是指数级别的。“慢启动” 只是指初使时慢,但是增长速度非常快。
为了不增长的那么快,因此不能使拥塞窗口单纯的加倍。
此处引入一个叫做慢启动的阈值
当拥塞窗口超过这个阈值的时候,不再按照指数方式增长,而是按照线性方式增长
当TCP开始启动的时候,慢启动阈值等于窗口最大值;
在每次超时重发的时候,慢启动阈值会变成原来的一半,同时拥塞窗口置回1;
少量的丢包,我们仅仅是触发超时重传;大量的丢包,我们就认为网络拥塞;
当TCP通信开始后,网络吞吐量会逐渐上升;随着网络发生拥堵,吞吐量会立刻下降;
拥塞控制,归根结底是TCP协议想尽可能快的把数据传输给对方,但是又要避免给网络造成太大压力的
时慢,但是增长速度非常快。
为了不增长的那么快,因此不能使拥塞窗口单纯的加倍。
此处引入一个叫做慢启动的阈值
当拥塞窗口超过这个阈值的时候,不再按照指数方式增长,而是按照线性方式增长
[外链图片转存中…(img-nBzTs4BE-1662605428901)]
当TCP开始启动的时候,慢启动阈值等于窗口最大值;
在每次超时重发的时候,慢启动阈值会变成原来的一半,同时拥塞窗口置回1;
少量的丢包,我们仅仅是触发超时重传;大量的丢包,我们就认为网络拥塞;
当TCP通信开始后,网络吞吐量会逐渐上升;随着网络发生拥堵,吞吐量会立刻下降;
拥塞控制,归根结底是TCP协议想尽可能快的把数据传输给对方,但是又要避免给网络造成太大压力的
折中方案。
传输层的重要协议——TCP相关推荐
- 《图解TCP/IP》笔记(十四)传输层两大协议TCP和UDP
前言:这是我<图解TCP/IP>笔记系列最后一篇(咕咕咕了将近两个月hh),TCP UDP其实面试的时候经常问到! 目录 传输层的定义: TCP与UDP对比 端口号 通信识别: 确定端口号 ...
- java实现ip首部校验和算法,理解传输层中UDP协议首部校验和以及校验和计算方法的Java实现...
UDP,全称User Datagram Protocol,用户数据报协议,是TCP/IP四层参考模型中传输层的一种面向报文的.无连接的.不能保证可靠的.无拥塞控制的协议.UDP协议因为传输效率高,常用 ...
- 计算机网络之传输层:6、TCP流量控制、滑动窗口协议
传输层:6.TCP流量控制 实现流量控制的方法: TCP流量控制: 实现流量控制的方法: 停止等待协议和滑动窗口协议 TCP流量控制:
- 计算机网络之传输层:3、TCP协议
传输层:3.TCP协议 TCP协议的特点: TCP报文首部格式: TCP协议的特点: 面向字节流: TCP将数据块看成一个字节一个字节的流,发送方发送数据时是以字节为单位进行发送的(上图每个标号表示一 ...
- 网络协议从入门到底层原理(5)传输层(UDP、TCP - 可靠传输、流量控制、拥塞控制、建立连接、释放连接)
传输层( Transport) 传输层( Transport) UDP 协议(数据格式.检验和) 端口(Port) TCP TCP - 数据偏移.保留 TCP - 检验和( CheckSum) TCP ...
- 【JavaEE】TCP的五层协议栈之应用层与传输层的UDP协议
文章目录 一.应用层 1.简单介绍 2.xml(Simple Object Access Protocol ) 2.json(JavaScript Object Notation) 4.protobu ...
- 计算机网络之传输层:5、TCP可靠传输
传输层:5.TCP可靠传输 TCP可靠传输: 伪首部校验: 实现可靠传输的过程: 实现可靠传输的工作原理: 实现流量控制的工作原理: TCP可靠传输: 伪首部校验: 与UDP校验一样,增加伪首部进行校 ...
- 计算机网络之传输层:7、TCP拥塞控制
传输层:7.TCP拥塞控制 TCP拥塞控制: 拥塞控制算法: 慢开始和拥塞避免: 快重传和快恢复: TCP拥塞控制算法综合: TCP拥塞控制: 拥塞控制算法: 发送方维持一个叫做拥塞窗口(cwnd) ...
- 计算机网络之传输层:4、TCP连接管理
传输层:4.TCP连接管理 TCP连接建立: 三次握手: SYN洪泛攻击: TCP连接释放: 四次握手: TCP连接建立: 三次握手: ROUND 1:建立连接请求,SYN=1 : 客户对服务器第一次 ...
最新文章
- android标题显示栏菜单在标题之下,Android菜单项标题不显示
- Effective Java~38. 用接口模拟可扩展的enum
- 蓝桥杯 ADV-75 算法提高 简单计算器
- 免费素材下载:200个超棒的矢量图标下载
- 【路径规划】基于matlab蚁群算法无人机巡检路径规划【含Matlab源码 138期】
- sql-labs超详细教程
- 如何在CAD中输入带圈序号?
- CFGAN--基于生成对抗神经网络的协同过滤推荐
- 对于java文件不能访问的情况分析
- SPI - 相关类型及其扩展
- 【协议基础】DNS协议概述DNS抓包分析
- java98道经典面试题
- 家用计算机如何连无线网,电脑上怎么连接wifi_怎样连接自己家的wifi-win7之家
- 2022/08/04、05 day01-2/02:Redis数据类型
- 群晖+picgo搭建私有图床
- 大写字母转化小写字母
- arm二进制文件转换成c语言,转换非常简单的ARM指令将二进制/十六进制(Converting very simple ARM i...
- 【数值优化之凸集与凸函数】
- 带你修改电脑用户名从中文到英文
- iOS微信第三方登录