前言

在开始这篇文章之前想先说一句:如果一套系统暂时没问题,那只是因为它的并发量不够而已。

上周在查看系统日志时,发现了一条与众不同的日志。日志中有一半内容是正常的报文数据,而另一半内容是0x00这样的空数据。

虽然系统没抛出任何异常,但这些日志肯定是反常的。多年的经验告诉我,这其中一定有什么不对的地方,加上好奇心的驱使,终于揭开了一个隐藏非常深的Bug。

有时候找到Bug,解决Bug很容易,难的是如何发现Bug,并推理出哪里出问题解决。下面就带大家来剖析一下这个Bug。

奇怪的日志输出

一个调用外部接口的基础类,打印出类似如下的日志:

abcdabcdabcdabcdabcdabcdabcd<0x00><0x00><0x00><0x00><0x00>

其中前面的abcd是正常的业务数据,后面莫名其妙的多出了很多<0x00>

那么,这个基础工具类有多基础?多处使用该方法,每天大约被调用几十万次吧,而上面的情况一天只会出现几次。就是那么巧,恰好被看到了。

查看代码,初步推断,可能是byte数组转String时,byte数组后半部分为空或存在一些无法转换的数据导致的。

旧代码分析

这里先把业务代码脱敏,写成一个demo展示给大家看看:

public static void oldCode() throws IOException {// 通过HttpURLConnection读取的外部系统返回的流InputStream in = new ByteArrayInputStream("abc".getBytes());// 明确知道的报文长度(解析Header获得)int bodyLen = 2048;byte[] body = new byte[bodyLen];int recvLen = 0;while (recvLen < bodyLen) {recvLen = in.read(body, recvLen, bodyLen - recvLen);if(recvLen == -1){break;}}System.out.println(new String(body, "GBK"));
}

上述代码进行了业务脱敏处理,仅为还原基本的使用过程。

业务场景的大概使用流程是:第一,通过HTTP调用远程接口;第二,读取接口返回的字节流,Inputstream;第三,解析字节流,存入字节数组;第四,将字节数组转换为String。

而日志中看到的异常内容,便是打印String时出现的。前面我们已经推断,出现<0x00>的可能性是字节数组有一部分为空导致或数据错误导致的。

上述代码有一个明显的错误,你是否能够看出来?根据代码原始的写法,推测之所以出现这个错误是因为使用者对InputStream的read方法并不熟悉导致的。

这里读者先自行阅读看看上述代码的Bug在哪里,下面我们来介绍一下InputStream的read方法。

InputStream的read方法

InputStream这个抽象类是表示字节输入流的所有类的超类,它提供了3个经常被使用的read()方法:

  • read(),无参方法。该方法从输入流中读取数据的下一个字节。返回0到255范围内的int字节值。如果因为已经到达流末尾而没有可用的字节,则返回值 -1 。该方法会处于阻塞状态,等待数据的到达,直到返回值为-1或抛出异常。
  • read(byte b[], int off, int len):将输入流中最多len个数据字节读入byte数组。尝试读取len个字节,但读取的字节也可能小于该值。以整数形式返回实际读取的字节数。
  • read (byte[] b):从输入流中读取一定数量的字节,并将其存储在缓冲区数组b中。以整数形式返回实际读取的字节数。

分析一下上面的三个方法。

其中第一个方法,本质上来说后两个方法都是调用第一个方法来实现的,但第一个方法直接使用缺点很明显,就是处理效率低下,一个字节一个字节的读。而后两个方法都加入了byte数组,用来作为缓存区。

而第三个方法又相当于第二个方法被如下方式调用:

read(b, 0, b.length)

而有Bug的代码中使用的是第二个方法。

Bug分析

看了read方法的API说明,你是不是已经找到Bug了?对的,当初写这段代码的人把read方法返回值理解错了。

recvLen = in.read(body, recvLen, bodyLen - recvLen);

最初写代码的人可能把read方法的返回值当中参数off经过读取之后新的位置了。这样在调用read方法之后,获得了填充的位置,然后拿总长度减去已经填充的位置,再继续读取后面的内容,继续填充。

但实际上read方法的返回结果是:以整数形式返回实际读取的字节数,可能与off的位置值相同,但并不是off的位置。

下面来分析一下while循环中的逻辑处理情况:

while (recvLen < bodyLen) {recvLen = in.read(body, recvLen, bodyLen - recvLen);if(recvLen == -1){break;}
}

我们举个例子来推演一下2种情况(为了方便推算,暂且用比较小的数来举例)。

情况一:假设bodyLen长度为10,read一次性读完。

在这种情况中,先进入while循环,read一次性读完,返回值为10,此时recvLen赋值为10,不再满足循环条件(recvLen < bodyLen),退出循环,继续执行。此时,代码没问题。这种情况可能占到99.9%-99.99%(取决于请求频次和报文大小)。

情况二:假设bodyLen长度为10,read 2次读完(发生粘包拆包现象)。

第一次循环,read读取6个字节长度,返回值为6,recvLen赋值为6。第二次循环,off参数取recvLen的值为6,读取剩余4个字节(10 - 6)。完成第二次读取,循环本应该结束的,但你会发现此时recvLen被赋值为4,依旧满足while循环的判断条件(recvLen < bodyLen),进行下一轮读取。

下一轮读取时,off变为4,len变为(10 - 4)。本来经过第二轮循环off已经读取到10了,现在又指定为4,又去流中读取。这就造成了日志中出现很多<0x00>

Bug原因

经过上述分析,我们已经找到Bug,并获得了Bug原因。

首先,Bug之所以没有大面积爆发,那是因为大多数请求都是一次性读完流中的数据,循环直接结束,当不会进入第二次循环时,这个Bug就被隐藏了。

其次,Bug之所以发生除了使用者对API的返回值不了解,更重要的原因是对于read方法可能会将结果分多次返回(粘包拆包现象)不了解。

Bug改造

找到原因,改造起来就非常容易了。针对demo我们重新改造一下:

public static void oldCode() throws IOException {// 通过HttpURLConnection读取的外部系统返回的流InputStream in = new ByteArrayInputStream("abc".getBytes());// 明确知道的报文长度(解析Header获得)int bodyLen = "abc".getBytes().length;System.out.println(bodyLen);byte[] body = new byte[6];int recvLen = 0;while (recvLen < bodyLen) {// 改造点1int currentLen = in.read(body, recvLen, bodyLen - recvLen);if(currentLen == -1){break;}// 改造点2recvLen += currentLen;}System.out.println(new String(body, "GBK"));
}

上述改造只改动了两处,将read方法的返回值用新变量接收,然后让recvLen每次累加read读取的字节数。

改造是不是非常简单?正应了那句话:改bug很容易,难的是如何找到bug。

小结

有时候我们对自己写的代码很自信,有时候总以为代码之前能够正常运行,以后也能够正常运行。但往往事与愿违,谁能想到一直“运行良好”的代码中深藏着这样的Bug?所以,还是那句话,如果你觉得你的代码没问题,那只是因为系统的并发量还不够而已。代码不仅要实现功能,还要满足性能和健壮性。

博主简介:《SpringBoot技术内幕》技术图书作者,酷爱钻研技术,写技术干货文章。

公众号:「程序新视界」,博主的公众号,欢迎关注~

技术交流:请联系博主微信号:zhuan2quan


程序新视界”,一个100%技术干货的公众号


捕获了一只发生概率小于万分之一的Bug相关推荐

  1. 好家伙,查看系统日志时我捕获了一只发生概率小于万分之一的Bug

    前言 在开始这篇文章之前想先说一句:如果一套系统暂时没问题,那只是因为它的并发量不够而已. 上周在查看系统日志时,发现了一条与众不同的日志.日志中有一半内容是正常的报文数据,而另一半内容是0x00这样 ...

  2. 蒙特卡洛方法_【每日一题56】蒙特卡洛方法 用试验所得的频率估计事件发生概率...

    关注"中考数学当百荟",感谢您的支持!点击"了解更多" 56.将两个圆形纸片(半径都为1)如图重叠水平放置(两圆相互过对方的圆心),向该区域随机投掷骰子,求骰子 ...

  3. 成功预测校园暴力发生概率的AI,会是大雄的哆啦A梦吗?

    你的校园生活快乐吗?相信很多人会回答"是的".但是有17.18%的人不这么觉得.上海海事大学的一份调研报告中显示,高校中有17.18%的人认为自己遭受过校园暴力. 抱团冷落.网络欺 ...

  4. 写了 12 年代码,仍旧奋斗在一线,佩服!

    大家好,我是树义.今天给大家推荐一位开发老哥,这位老哥连续写了 12 年代码,现在在创业公司做技术总监.但是其仍然奋斗在技术一线,研究源码.深入排查问题. 这期间还出了不少关于 SpringBoot ...

  5. scrapy_redis去重优化(已有7亿条数据),附Demo福利

    背景: 前些天接手了上一位同事的爬虫,一个全网爬虫,用的是scrapy+redis分布式,任务调度用的scrapy_redis模块. 大家应该知道scrapy是默认开启了去重的,用了scrapy_re ...

  6. 郝志峰《概率论与数理统计》期末复习笔记

    目录 前言 第一章        概率论的基础概念 知识大纲 随机试验 随机事件 事件概率 等可能概率模型 第二章        概率论的基本定理 知识大纲 条件概率 独立性 全概率公式 贝叶斯公式 ...

  7. 汽车控制器软件EMC技术(一)

    在汽车控制器的设计阶段应尽可能早的考虑EMC骚扰问题,以提升产品的安全性和可靠性.而通过软件的方法来提升EMC性能,是一种非常廉价的提升产品性能的方案.因此,在软件的模拟和数字数据设计时,必须考虑EM ...

  8. 显著性水平、置信区间、假设检验与方差分析知识点总结

    显著性水平.置信区间.假设检验与方差分析相关知识点总结 参数说明 显著性水平 显著性水平检验 置信区间 假设检验 参数检验 F检验 t检验 Z检验 非参数检验 卡方检验(✘2检验) 秩和检验 常用的假 ...

  9. 互联网+废品回收项目需求分析报告

    本项目设计书为笔者软件工程课的作业,由于时间有限较为粗糙,不合理之处还望指出并改正. 互联网+废品回收项目可行性分析报告 互联网+废品回收项目需求分析报告 互联网+废品回收项目概要设计说明书 互联网+ ...

最新文章

  1. 【经验】提高github的下载(克隆)速度
  2. VC编辑框(EDIT)的自动换行、自动滚屏 、到指定行数自动清空
  3. navicat for mysql 13_Navicat for MySQL下载
  4. python规范模块和包
  5. 计算机开题报告参考文献,开题报告中参考文献.docx
  6. JAVA变量初始化赋值null
  7. php为什么要创建类,php – 是否有理由为单一功能创建类?
  8. model中的数据如何显示在html上,django – 使用DRF ModelViewSet和TemplateHTMLRenderer时如何访问模板中的数据?...
  9. 公司居然使用监听设备,大家来讨论下IT公司应该怎样管理
  10. android滚动视图实例,android实现自定义滚动条
  11. NoteExpress自定义题录表头显示字段
  12. 给出直角三角形斜边,求有多少三角形符合要求
  13. icepdf 将pdf转换为图片
  14. 【java】案例一:使用java写的记账软件
  15. php获取小米手环数据,小米运动App数据提取
  16. 【网络通信】Teardrop编程创造虚假IP包
  17. 解决Ubunt20.04安装Sogou输入法失败进不去桌面 及 中文输入法安装
  18. web网站服务器宕机应急,web服务器的宕机诊断方法
  19. 成都市计算机企业管理学校,成都2021年计算机管理院校排行榜
  20. 软件测试之搜索框功能点用例梳理

热门文章

  1. c调用c++ qt_C#调用C++(QT5.5.1项目)的C++/CLI(CLR项目)项目技术笔记
  2. 基于matlab的多径信道的仿真
  3. 阅文java服务端开发_阅文笔试复盘
  4. [USACO 2012 Feb B]Moo - 规律
  5. C#项目:未找到引用错误解决方案
  6. 人气爆棚 航嘉亮相华中科技大学现场
  7. 长途汽车信息管理数据库的设计与实现
  8. 学霸创业团队的崛起:以大数据重塑K12在线教育
  9. 《调色师手册:电影和视频调色专业技法(第2版)》——配置调色影院
  10. 有什么好用的图片编辑软件?这个编辑软件很好用