在进行Java NIO学习时,发现,如果客户端连续不断的向服务端发送数据包时,服务端接收的数据会出现两个数据包粘在一起的情况,这就是TCP协议中经常会遇到的粘包以及拆包的问题。

一、什么粘包和拆包?

现在假设客户端向服务端连续发送了两个数据包,用packet1和packet2来表示,那么服务端收到的数据可以分为三种,现列举如下:

1.接收端正常收到两个数据包,即没有发生拆包和粘包的现象,此种情况不在本文的讨论范围内。

2.接收端只收到一个数据包,由于TCP是不会出现丢包的,所以这一个数据包中包含了发送端发送的两个数据包的信息,这种现象即为粘包。这种情况由于接收端不知道这两个数据包的界限,所以对于接收端来说很难处理。

3.这种情况有两种表现形式,如下图。接收端收到了两个数据包,但是这两个数据包要么是不完整的,要么就是多出来一块,这种情况即发生了拆包和粘包。这两种情况如果不加特殊处理,对于接收端同样是不好处理的。

TCP是个“流”协议,没有界限的一串数据。TCP底层并不了解上层业务数据的具体含义,它会根据TCP缓冲区的实际情况进行包的划分,所以在业务上认为,一个完整的包可能会被TCP拆分成多个包进行发送,也有可能把多个小的包封装成一个大的数据包发送,这就是所谓的TCP粘包和拆包问题。

二、粘包、拆包发生的原因

  1. 要发送的数据大于TCP发送缓冲区剩余空间大小,将会发生拆包。

  2. 待发送数据大于MSS(最大报文长度),TCP在传输前将进行拆包。

  3. 要发送的数据小于TCP发送缓冲区的大小,TCP将多次写入缓冲区的数据一次发送出去,将会发生粘包。

  4. 接收数据端的应用层没有及时读取接收缓冲区中的数据,将发生粘包。

三、粘包、拆包解决办法

由于底层的TCP无法理解上层的业务数据,所以在底层是无法保证数据包不被拆分和重组的,这个问题只能通过上层的应用协议栈设计来解决,根据业界的主流协议的解决方案,归纳如下:

  1. 消息定长。发送端将每个数据包封装为固定长度(不够的可以通过补0填充),这样接收端每次接收缓冲区中读取固定长度的数据就自然而然的把每个数据包拆分开来。

  2. 设置消息边界。服务端从网络流中按消息边界分离出消息内容。在包尾增加回车换行符进行分割,例如FTP协议。

  3. 将消息分为消息头和消息体,消息头中包含表示消息总长度(或者消息体长度)的字段。

  4. 更复杂的应用层协议,比如Netty中实现的一些协议都对粘包、拆包做了很好的处理。

四、Netty的拆包解决方案

Netty这个框架,对于客户端和服务端之间的数据传输做了很好的处理,服务端在发送数据之前先对数据按一定的规则进行编码,客户端在接收到数据后按照相同的规则进行解码,这就是Netty解决粘包拆包问题的思路,下面我们详细来看一看。

拆包这个工作,Netty 已经为大家备好了很多不同的拆包器。本着不重复发明轮子的原则,我们直接使用Netty现成的拆包器。

Netty 中的拆包器大致如下:

1.固定长度的拆包器 FixedLengthFrameDecoder

每个应用层数据包的都拆分成都是固定长度的大小,比如 1024字节。

对于使用固定长度的粘包和拆包场景,可以使用FixedLengthFrameDecoder,该解码一器会每次读取固定长度的消息,如果当前读取到的消息不足指定长度,那么就会等待下一个消息到达后进行补足。其使用也比较简单,只需要在构造函数中指定每个消息的长度即可。这里需要注意的是,FixedLengthFrameDecoder只是一个解码一器,Netty也只提供了一个解码一器,这是因为对于解码是需要等待下一个包的进行补全的,代码相对复杂,而对于编码器,用户可以自行编写,因为编码时只需要将不足指定长度的部分进行补全即可。

数据在编码发送的时候,也会以固定长度作为一调完整的消息。

2.行拆包器 LineBasedFrameDecoder

每个应用层数据包,都以换行符作为分隔符,进行分割拆分。

数据在编码发送的时候,会以换行符作为一条完整的消息。

3.分隔符拆包器 DelimiterBasedFrameDecoder

每个应用层数据包,都通过自定义的分隔符,进行分割拆分。这个版本,是LineBasedFrameDecoder 的通用版本,本质上是一样的。

数据在编码发送的时候,会以一个自定义的分隔符作为一条完整的消息。

4.基于数据包长度的拆包器 LengthFieldBasedFrameDecoder

将应用层数据包的长度,作为接收端应用层数据包的拆分依据。按照应用层数据包的大小,拆包。这个拆包器,有一个要求,就是应用层协议中包含数据包的长度。

LengthFieldBasedFrameDecoder与LengthFieldPrepender需要配合起来使用,其实本质上来讲,这两者一个是解码,一个是编码的关系。它们处理粘拆包的主要思想是在生成的数据包中添加一个长度字段,用于记录当前数据包的长度。LengthFieldBasedFrameDecoder会按照参数指定的包长度偏移量数据对接收到的数据进行解码,从而得到目标消息体数据;而LengthFieldPrepender则会在响应的数据前面添加指定的字节数据,这个字节数据中保存了当前消息体的整体字节数据长度。

数据在编码发送的时候,会指定当前这条消息的长度。

五、实战:远扬通信中自定义协议的粘包、拆包解决方案

对于我们要做的项目,也可以自己定义消息传输的协议,在我做过的一个项目中,远洋货轮需要进行通信,大家都知道,在海上信号是很差的,每次收消息都很难保证收到的是一条完整的消息,但此时我们可以自定义协议,在消息的头部用两个字节把本次消息发送的长度加上,中间部分是消息正文,消息的尾部用四个字节保存本条消息md5值的低四位。这样,接收方在收到部分消息后,可根据消息的头部判断该条消息的具体长度,然后继续接收消息,当收到完整的消息后,在去计算接收到消息的md5四位,去跟接收的低四位做比较,如果一致,就认为是收到了完整的消息,接着根据约定的协议进行解码交流。

当然,消息的校验位还是比较复杂的,需要给每台设备都指定唯一标识来区别身份等,这里就不展开叙述了。

此种方案特别适合网络环境差的情况,能保证正常的通信。也经受住了实战的考验,基本可以做到消息的零丢失。

六、总结:一个面试题

我们都知道TCP属于传输层的协议,传输层除了有TCP协议外还有UDP协议。

那么UDP是否会发生粘包或拆包的现象呢?

答案是不会。UDP是基于报文发送的,从UDP的帧结构可以看出,在UDP首部采用了16bit来指示UDP数据报文的长度,因此在应用层能很好的将不同的数据报文区分开,从而避免粘包和拆包的问题。

而TCP是基于字节流的,虽然应用层和TCP传输层之间的数据交互是大小不等的数据块,但是TCP把这些数据块仅仅看成一连串无结构的字节流,没有边界;另外从TCP的帧结构也可以看出,在TCP的首部没有表示数据长度的字段,基于上面两点,在使用TCP传输数据时,才有粘包或者拆包现象发生的可能。

参考资料:

  1. https://blog.csdn.net/ailunlee/article/details/95944377

  2. https://blog.csdn.net/wxy941011/article/details/80428470

  3. http://www.sohu.com/a/302231889_120045139

  4. https://blog.csdn.net/crazymakercircle/article/details/83957259

有道无术,术可成;有术无道,止于术

欢迎大家关注Java之道公众号

好文章,我在看❤️

粘包拆包,Netty及远洋通信中的解决方案!超实用相关推荐

  1. 网络(15)-粘包拆包,Netty解决方案及远洋通信中的解决方案!超实用

    在进行Java NIO学习时,发现,如果客户端连续不断的向服务端发送数据包时,服务端接收的数据会出现两个数据包粘在一起的情况,这就是TCP协议中经常会遇到的粘包以及拆包的问题. 一.什么粘包和拆包? ...

  2. 「 计算机网络 」TCP的粘包拆包问题

    「 计算机网络 」TCP的粘包/拆包问题 参考&鸣谢 大病初愈,一分钟看懂TCP粘包拆包 雷小帅 TCP 的粘包拆包以及解决方案 一乐说 文章目录 「 计算机网络 」TCP的粘包/拆包问题 一 ...

  3. tcp协议缓冲区溢出_关于TCP 粘包拆包,你了解吗?

    一.什么是粘包拆包? 粘包拆包是TCP协议传输中一种现象概念.TCP是传输层协议,他传输的是"流"式数据,TCP并不知道传输是哪种业务数据,或者说,并不关心.它只是根据缓冲区状况将 ...

  4. Netty中的粘包拆包

    文章目录 一.问题描述: 1. 什么是粘包.拆包 2. 粘包拆包演示 二.解决思路: 三.解决方案: 一.问题描述: 1. 什么是粘包.拆包 粘包和拆包是TCP网络编程中不可避免的,无论是服务端还是客 ...

  5. netty的编解码、粘包拆包问题、心跳检测机制原理

    文章目录 1. 编码解码器 2. 编解码序列化机制的性能优化 3. Netty粘包拆包 4. Netty心跳检测机制 5. Netty断线自动重连实现 1. 编码解码器 当你通过netty发送或者接受 ...

  6. Netty编解码,粘包拆包及零拷贝

    Netty编解码 Netty涉及到编解码的组件有Channel.ChannelHandler.ChannelPipe等,先大概了解下这几个组件的作用. ChannelHandler ChannelHa ...

  7. 深入理解Netty编解码、粘包拆包、心跳机制

    点赞再看,养成习惯,公众号搜一搜[一角钱技术]关注更多原创技术文章. 本文 GitHub org_hejianhui/JavaStudy 已收录,有我的系列文章. 前言 BIO .NIO .AIO 总 ...

  8. 什么是粘包和拆包,Netty如何解决粘包拆包?

    Netty粘包拆包 TCP 粘包拆包是指发送方发送的若干包数据到接收方接收时粘成一包或某个数据包被拆开接收. 如下图所示,client 发送了两个数据包 D1 和 D2,但是 server 端可能会收 ...

  9. Netty 粘包 拆包 编码 解码 序列化 介绍

    目录: 粘包 & 拆包及解决方案 ByteToMessageDecoder 基于长度编解码器 基于分割符的编解码器 google 的 Protobuf 序列化介绍 其他的 前言 Netty 作 ...

最新文章

  1. WPF关闭应用程序,释放Window窗口资源方法
  2. 独家 | 在Python中使用广义极端学生化偏差(GESD)进行异常检测(附链接)
  3. Linux 用户被差别对待?无法通过 apple.com 管理 Apple ID
  4. 关于Linux命令ls的一道笔试题
  5. 计算机科学导论 第4版,计算机科学导论.第4版
  6. wxWidgets:wxTextOutputStream类用法
  7. ITK:创建另一个图像实例
  8. 陕西专科学校王牌计算机专业,陕西省高职专科院校排名+王牌专业
  9. 16张图带你吃透高性能 Redis 集群
  10. python幂运算的符号有哪些及画法_SymPy 符号计算基本教程
  11. jedate选择一年范围日期插件
  12. 2022年第三届全国大学生网络安全精英赛
  13. 沧州中考计算机考试时间,2017年沧州市中考考试科目及时间
  14. 解决Spark数据倾斜(Data Skew)的 N 种姿势 与 问题定位
  15. Linux下sqlite3移植与编程
  16. 圣思园官方论坛正式上线,众板块版主火热招募中,欢迎围观
  17. 生活:电影穿普拉达的女王(the Devil Wears Prada)的感想
  18. 石油管道巡线案例:SABER无人机高原2500米轻松作业
  19. 网络编程全解(Java)
  20. 项目管理十大知识领域47个子过程

热门文章

  1. php 文本处理 库,处理文本的PHP库
  2. java某个起点出发的最长路径_【leetcode-动态规划】矩阵中的最长递增路径
  3. pandas分组计算平均值_pandas索引,分组计算
  4. 在Windows 下使用CodeBlocks 自带编译器实现对编译的优化
  5. 数据结构之二叉树的逻辑结构和遍历
  6. (软件工程复习核心重点)第三章需求分析习题
  7. (王道408考研数据结构)第八章排序-第一节:排序综述
  8. Tensorflow实现多元线性回归
  9. 防止API被恶意调用,一般有哪些方法?
  10. Redis Config Set 命令