这篇文章是转载的一高人 原文地址
http://network.51cto.com/art/201006/208156.htm
转载请注明!
故障现象
笔者所在单位的局域网是由一个中心机房的工作子网和各个楼层的工作子网组成,中心机房的工作子网中有包括Web服务器在内的各个应用系统服务器以及核心路由交换机,各个楼层的工作子网全部通过千兆光纤线路与中心机房的核心交换机保持连接,局域网中的所有终端电脑全部通过超5类双绞线实现与各个楼层交换机的百兆网络互联。为了抑制广播风暴现象以及网络病毒的疯狂传播,网络管理员采用VLAN技术将整个局域网划分成了不同的虚拟工作子网,所有虚拟工作子网全部通过中心机房的核心路由交换机实现不同虚拟工作子网之间的路由。
平时,整个局域网中的所有终端电脑都能正常上网,并且上网速度也非常理想。可是,最近这几天,网络管理员不断接到来自五楼不同用户的电话报修故障,声称它们的终端电脑上网访问速度突然变慢,从网上下载信息时一点也没有以往一气呵成的感觉了,现在的下载速度就象蜗牛一样爬行,经常要访问的站点也打不开了,电子邮件也不能正常收发了。接到故障求援之后,网络管理员立即从自己的终端电脑出发,使用ping命令测试五楼楼层接入交换机的IP地址,结果发现这项测试操作延迟现象十分严重,而且数据丢包率达到了惊人的16%左右,这在一个规模不大的局域网网络中来说是不应该的。既然故障现象发生了,网络管理员立即采取措施,进行了以下排查操作。
故障排查
考虑到最近一段时间,整个局域网网络曾经发生过网络病毒疯狂肆虐的现象,为此网络管理员首先将故障排查对象锁定在网络病毒身上;因为一旦局域网中真的存在许多网络病毒,并且这些病毒同时爆发的话,那么对应网络中的有限出口带宽资源可能会被大量占用,那么终端电脑上网速度自然会受到明显影响。为了判断网络病毒是否是上述故障现象的祸首,网络管理员立即赶到五楼楼层交换机现场,将自己随身携带的笔记本电脑通过Console控制线缆连接到该楼层交换机上,然后在笔记本电脑中运行Sniff程序进行数据抓包分析;结果网络管理员发现,这个楼层的虚拟工作子网内当前上线的终端电脑数量只有二三十台,而对应工作子网内的数据包流量也不是很大;在这种情形下,网络管理员尝试通过该楼层的交换机进行上网访问时,发现网页内容仍然无法访问,电子邮件收发也无法进行,看来造成这种故障现象的因素不是网络病毒。
在排除网络病毒因素后,网络管理员又对这个楼层的交换机设备进行了仔细观察,发现连接到该交换机的终端电脑数量比较多,而且对应交换机的型号属于低端产品,它的自身运行性能也是一般。正常情况下,这种低端的楼层交换机持续运行的时间比较长的话,很有可能出现系统缓存溢出错误等,或者交换机内部的性能元件发生老化现象,这些现象都会影响交换机的运行稳定性。对于这样的“软”故障现象,往往都能通过重新启动的方法来解决,依照这样的思路,网络管理员立即重新启动了一下五楼楼层交换机系统,没有多长时间,该交换机就启动稳定了。原以为这次努力能够解决问题,可是当网络管理员再次从自己的笔记本电脑中访问目标站点页面中的内容时,发现网络访问速度仍然非常缓慢,显然网络通道仍然处于堵塞状态。
既然故障现象与网络病毒以及楼层交换机自身运行状态没有关系,那么究竟是什么因素造成了这种故障现象呢?经过仔细思索,网络管理员突然联想到了网络环路因素,因为局域网中一旦存在网络环路现象的话,同样能够产生广播风暴现象,从而可能会堵塞网络传输通道,那么局域网中究竟存在不存在网络环路现象呢?正常情况下,如果五楼工作子网中存在网络环路现象的话,那么对应楼层的交换机上的所有信号灯状态都应该处于不停闪烁状态。基于这样的分析,网络管理员立即对楼层交换机控制面板上的信号灯状态进行了观察,结果发现这些交换端口信号灯果然存在闪烁过于频繁的嫌疑;于是,网络管理员立即断开楼层交换机与对应楼层的光纤收发器之间的连接线路,通过普通的网络线缆将自己的笔记本电脑连接到对应楼层的光纤收发器网络端口上,满以为这次可能能够解决问题,可是网络管理员再次在笔记本电脑中访问目标站点页面时,网页内容竟然还是无法打开,之前出现的故障现象仍然存在,很明显这样的故障现象与楼层交换机没有任何关系!
在确认上面的故障现象与楼层交换机没有任何关系之后,网络管理员又将故障排查的范围缩小到光纤连接跳线、光收发器、中心机房的核心交换机上了,因为只有这些位置的设备或线缆没有检查了。由于除了五楼之外的其他楼层交换机同样也是连接到中心机房的核心交换机上的,仔细观察其他楼层用户的上网状态时,发现它们都是正常的,所以从这一点来看,网络管理员估计中心机房的核心交换机自身工作状态是正常的。那有没有可能是连接五楼楼层交换机的核心交换机端口存在问题,导致五楼用户不能正常通过核心交换机访问网络呢?联想到这一点,网络管理员立即以系统管理员权限登录进入核心交换机后台,进入连接五楼的交换端口视图配置界面,使用“display interface”命令查看该交换端口的状态信息时,没有发现有什么异常现象,同时该交换端口的工作状态也处于“up”状态。后来,网络管理员担心连接五楼交换机的光纤收发器以及光纤跳线接头存在问题,于是又不厌其烦地采用手工方法对光纤连接跳线线头进行了卫生清洁工作,同时又替换了光纤收发器设备,可即使这样努力,故障排查工作还是一点没有进展。
故障解决
在万般无奈之下,网络管理员只好赶到中心机房,来到核心交换机现场,仔细观察核心交换机的物理连接时,终于弄清楚了故障产生的根源。我们知道,普通的光纤收发器设备通常只有一对光口以及一个普通的以太网端口,其中光口是专门用来连接光纤跳线的,以太网端口可以连接终端电脑进行网络访问测试;可是,中心机房使用的光纤收发器设备却与众不同,它同时拥有两个普通的以太网端口,它的作用与一只包含两个交换端口的微型交换机相当。正常情况下,我们只会同时用到一个以太网端口和连接光纤跳线的光口,另外一个以太网端口平时不怎么用到;可是网络管理员在这里却看到,连接核心路由交换机的光纤收发器,同时使用了两个普通的以太网端口,分别沿着这两个以太网端口的连接线缆进行查询时,网络管理员发现它们竟然同时连接到核心交换机设备上了,只是它们连接到核心交换机不同的Vlan接口上罢了。由于各个楼层的Vlan全部设置在核心路由交换机上,各个楼层Vlan相互之间的访问路由也配置在该设备上,当连接五楼的光纤收发器上的两个普通以太网端口同时连接到核心路由交换机上时,对应光纤收发器与核心路由交换机之间无形之中就形成了网络环路现象,结果造成对应光纤收发器的连接端口被大量的数据包堵塞,从而影响了五楼用户的上网访问速度。
找到了故障产生的“罪槐祸首”后,网络管理员立即从连接五楼的光纤收发器上拔下了多余的网络连接线缆,再次使用笔记本电脑从五楼网段进行目标网站的访问时,发现网络访问速度已经恢复到正常状态,同时发现收发电子邮件等操作也恢复了正常,这说明五楼的网络故障现象已经彻底消失了。
原因探究
上面的故障现象虽然已经被成功解决了,但是让网络管理员感到疑惑不解的是,为什么光纤收发器上的两个普通以太网接口会同时连接有网络线缆?网络管理员经过仔细观察看到。在中心机房的接线柜内同时安装了来自其他楼层的十几个光纤收发器设备,其中某个光纤收发器设备由于发生了硬件质量问题被暂时从接线柜内移走了,不过对应设备的电源连接线缆以及网络连接线缆仍然还放置在接线柜内;网络管理员询问中心机房的其他工作人员时得知,前几天另外一个工作人员在对大楼网络设备正常巡检时,看来保留下来的网络线缆时,以为是该网络线缆由于接触不牢靠从设备上滑落下来了,于是下意识地将它连接到来自五楼的光纤收发器设备上了,这样一则奇怪的网络故障现象就在不经意间发生了。
从这则故障的产生过程来看,笔者认为平时遭遇到的许多网络故障现象,都是由于网络管理员自己在工作过程中粗心大意引起的。所以,为了保证局域网网络能够始终稳定地运行,我们除了在安装、组建的时候,要严格遵守网络布线标准外,还需要在平时加强对网络工作环境的维护,千万不能图一时的操作便利而轻易留下故障隐患。  
这是做小网管的首篇文章 更多的学习继续ing~

转载于:https://blog.51cto.com/nanshan/346191

巧妙排查 揪出堵塞网络通信的祸首相关推荐

  1. 装mysql最后一步没响应_每天14点遭遇惊魂时刻,如何一步一步揪出真凶?

    " 笔者所在的公司有一款大 DAU(日活)的休闲游戏.这款游戏的后端架构很简单,可以简单理解为通讯-逻辑-存储三层结构.其中存储层大量使用了 Redis 和 MySQL. 图片来自 Pexe ...

  2. oracle如何查看某个时间段调用的函数的异常信息_每天14点遭遇惊魂时刻,如何一步一步揪出真凶?...

    笔者所在的公司有一款大 DAU(日活)的休闲游戏.这款游戏的后端架构很简单,可以简单理解为通讯-逻辑-存储三层结构.其中存储层大量使用了 Redis 和 MySQL. 图片来自 Pexels 随着存量 ...

  3. 揪出偷偷消耗资源的黑手!

    16340284 [数据科学与计算机学院] (http://sdcs.sysu.edu.cn/) 张山丰 不久前是国庆,相信大家都非常高兴,因为不仅有丰富多彩的假期,还是流量清零重新计算的日期,但不管 ...

  4. 开发者被要求向破解者道歉,竟揪出“阿里云假员工”,网友:这人有前科

    文末包邮送3本技术书! 浩楠 鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 咄咄怪事,起于知乎. 「我是如何被逼到向我软件的破解者道歉的?」 没错,就是这样一则愤怒和无奈溢出屏幕的&qu ...

  5. 揪出“凶手”——实战WinDbg分析电脑蓝屏原因

    http://www.appinn.com/blue-screen-search-code/ 蓝屏代码查询器 – 找出蓝屏的元凶 11 文章标签: windows / 系统 / 蓝屏. 蓝屏代码查询器 ...

  6. 如何找出电脑里的流氓软件_啥拦截软件都挡不住?教你一键揪出乱弹窗的流氓软件...

    [PConline 应i用]最近很多朋友都向笔者表示了想要购买新MacBook的想法,一方面是由于M1芯片性能非常强劲,另一方面也在于想要体验一下macOS--Windows系统上的流氓软件弹窗,实在 ...

  7. 揪出MySQL延迟上千秒的元凶

    揪出MySQL延迟上千秒的元凶 背景 Part1:写在最前 MySQL的延迟告警想必大家一定不陌生,MySQL引起从库延迟的原因有很多,从硬件上讲可能是网卡,磁盘,内存达到瓶颈,从数据库层面来讲,可能 ...

  8. 探测电磁波就能揪出恶意软件,网友:搁这给电脑把脉呢?

    博雯 萧箫 发自 凹非寺 量子位 | 公众号 QbitAI 不安装任何杀毒软件,"悬丝诊脉"也能揪出计算机病毒? 而且准确率达99.82%,杀毒软件看了都汗颜. 先请出我们的&qu ...

  9. 让Windows 7揪出每一个暗中运行程序

    让Windows 7揪出每一个暗中运行程序 Windows用户都知道,可以通过任务管理器查看当前都有哪些程序在运行,并可以查看到各程序占用的CPU和内存等情况.但是,通过Windows系统内置的任务管 ...

  10. 黑科技DeepFake检测方法:利用心跳做信号,还能「揪出」造假模型

    本文转载自机器之心. 选自arXiv 作者:Umur Aybars Ciftci等 机器之心编译 编辑:陈萍 DeepFake 真的可以达到以假乱真的效果吗?未必.来自宾汉姆顿大学.英特尔公司的研究人 ...

最新文章

  1. 谷歌低调了 5 年的 Fuchsia OS,终于有望面世了!
  2. 软件测试用python一般用来做什么-月薪20K的软件测试岗,为什么要求我会Python?...
  3. APICloud开发者进阶之路 | 超级实用技巧
  4. opencv进阶学习笔记11:cannny边缘检测,直线检测,圆检测
  5. Python Web开发:开发wsgi中间件
  6. Windows进程系列(2) -- Svchost进程
  7. 江山控股附属斥资3.02亿收购云阳新能源发电100%股权并偿债
  8. 讯飞 tts 9.0 app_讯飞B1录音笔,到底值不值得买?
  9. 朱晔和你聊Spring系列S1E5:Spring WebFlux小探
  10. java 弹框_java弹框
  11. 周遭心理学的应用-什么是心理学?
  12. 创业成功第一步:写好商业计划书 第一章习题答案
  13. linux可运行的steam游戏吗,Steam现在可以在Linux上玩仅Windows游戏
  14. Photoshop提示暂存盘已满怎么办?ps暂存盘已满如何解决?
  15. 建广数科(文思海辉)招聘
  16. 关于某课堂的视频文件ts文件下载——m3u8加密问题
  17. PPT打开出错/可尝试修复此演示文稿
  18. Android Studio 模拟器重启(解决模拟器卡死问题)
  19. 通过一款早期代码抽取壳入门学习 so 层分析
  20. Quartus Prime Standard 18.1下载 安装流程

热门文章

  1. Python中如何安装pip,xlrd
  2. Apache Flink 官方文档--流(DataStream API)-旁路输出
  3. Gradle下载 Jar 包
  4. Linux系统优化之网络IO调优
  5. pdf.js跨域加载文件
  6. vmware 网络连接
  7. 在vs2010 .net 4.0 引用dll .net 2.0(转)
  8. 禁止屏幕保护使用密码
  9. MySQL 和 MySQL Workbench图形化安装教程
  10. 求整数数组的最小值c语言,编程实现求一个整数数组num[]中的最大值与最小值并输出结果的程序...