原标题:【网安学术】基于NQA策略的RRPP优化机制

摘要:作为以太网的一种环网保护协议,RRPP能有效检测网络故障并迅速收敛路由,降低故障对整个网络的影响,但协议本身还存在着关键性缺陷。对于部分极端情况故障,RRPP无法实现有效检测,反而甚至可能会引发广播风暴。在环网结构中使用NQA策略配合RRPP协议的保护机制,可以实现功能的完善。经测试验证,NQA策略能有效修复RRPP协议可能产生的广播风暴,弥补RRPP的漏洞。该方案对于提高运营商数据承载网的安全性具有重要的意义。

0 引 言

随着网络技术的不断进步,城市信息化建设的发展日新月异,对网络可靠性的要求也愈来愈高。在企业网和城域网的设计中,为实现良好的可靠性,通常采用环网结构实现网络拓扑构建[1]。常用的环网技术有RPR[2]和以太网环[3]。RPR需要专用硬件,成本较高。相比之下,以太网环的建设成本低,且技术也在不断成熟完善。因此,企业网和城域网越来越多地采用以太网环技术实现网络的架构。

解决二层网络环路问题[4]的常用技术有STP(Spanning Tree Protocol,生成树协议)[5]和RRPP(Rapid Ring Protection Protocol,快速环网保护协议)[6]。STP在二层交换网络中应用较广泛,能有效防止二层网络产生环路。RRPP则适用于大规模网络,在运营商城域网中运用较多。相较于STP,RRPP具有更快的收敛速度[7]。但是,在实际日常运维中发现,RRPP技术只对解决环网中链路中断故障能起到很好的保护冗余作用[8],一旦环路发生丢包催报情况,RRPP不但不能有效切换业务,而且有可能导致整个环网产生广播风暴。因此,在RRPP协议基础上,配合报文探测和路由策略强化RRPP环网的安全性,显得至关重要。

1 RRPP运行机制隐患

RRPP是主要应用在以太网环中起保护作用的数据链路层协议。当环网状态正常时,通过阻塞端口防止产生环路,可避免广播风暴[9]。而当环网中断时,它能迅速检测故障并切换数据流,收敛速度较高。

RRPP环上的设备按功能可划分为主节点和传输节点。每个环上有且仅有一个主节点,其余设备为传输节点。主节点用来控制整个环网状态,主要负责发送和接收检测报文,并根据接收检测报文的情况决定是否执行操作。传输节点负责转发检测报文,同时监控与自己相关的RRPP链路状态,并把链路的状态变化事件通过协议报文告知主节点,由主节点做执行操作的最终决策。

RRPP环上的每一台设备都会配置两个RRPP端口,用以转发RRPP报文。主节点的主端口会在预先设定的RRPP控制VLAN内周期性地发送Hello报文,用以检测环网的状态,而副端口则用来接收该报文。传输节点负责在RRPP环网上转发由环上的主节点发出的Hello报文。若环网状态是健康的,主节点将在其副端口上收到自己发出的Hello报文,并保持副端口的业务数据处于阻塞状态,只接收控制VLAN的协议报文。若环路状态是断裂的,则主节点发出的Hello报文将无法通过环网回到自己的副端口,此时主节点的副端口将解除阻塞状态,承担转发数据的任务,同时发送协议报文通知RRPP环网上的其他节点环网状态已发生变换。传输节点在收到通知报文后,自动更新其MAC表项,将业务数据切换至正常的链路。此外,当传输节点发现其主端口或副端口中断时,也会发送报文用以通知环网的主节点。主节点收到该报文后,解除业务数据在副端口的阻塞状态,并发送协议报文通知其他节点。各节点在收到通知报文后,自动更新其MAC表项,并切换业务数据流。故障修复后,主节点的副端口将重新收到其主端口发送的Hello报文。此时,主节点将再次阻塞其副端口,RRPP环网将恢复到健康状态。

但是,实际网络运维过程中,RRPP协议在部分情况下存在漏洞,可能引发广播风暴。RRPP工作在环形网络结构中,且在RRPP的环网结构中是关闭STP协议的。整个环网的安全完全依靠RRPP的工作实现。虽然通过RRPP协议阻断了数据流的环路,但依然存在广播风暴的隐患。由RRPP协议的工作机制可以看出,RRPP可以迅速检测出环网中的断点并及时切换数据流,保证业务不受影响。对于链路中断的故障,RRPP具有高效的收敛效果。但是,环网上若发生丢包情况,RRPP的保护效果将大大降低,甚至可能引发更大故障,导致网络瘫痪。当环网中某条链路出现拥塞或某台传输节点设备交换芯片转发功能出现故障时,从主节点发送的HELLO报文则可能在传输过程中被丢弃或超时。因此,副端口将无法收到该探测报文而触发保护机制,解除数据VLAN在其副端口的阻塞状态,导致整个环网数据流构成环路,引发网络中的广播风暴。因此,需要在环网上通过配置其他策略配合RRPP协议工作,以保护网络的安全。

2 在RRPP环中部署监控策略

为了应对上述可能发生的故障,可以通过NQA(Network Quality Analyzer,网络质量分析)[10]探测并结合EAA(Embedded Automation Architecture,嵌入式自动化架构)策略来规避此问题。总体思路是,如果主节点的从端口收不到RRPP的控制报文,而现网产生环路,势必会影响NQA的探测。此时,如果NQA存在探测失败,则通过Track联动模块监控NQA,发现NQA探测失败时,将主节点的副端口进行关闭操作,从而避免产生环路。

Track的用途是实现联动功能,如图1所示。联动功能是通过配置若干策略,在特定事件发生后,根据监测模块的监控结果关联应用模块的相应策略,从而实现路由控制。在RRPP环网中,通过配置NQA对环网状态进行检测,同时将监测结果与Track模块进行关联,一旦监测失效,则通过Track联动,触发应用模块策略,强行关闭环网主节点的副端口,防止环网产生环路,以免引起网络中的广播风暴。

NQA通过发送探测报文,对链路状态、网络性能、网络提供的服务及服务质量进行分析,并为用户提供标识当前网络性能和服务质量的相关参数[11],如时延、抖动时间、TCP连接建立时间、FTP连接建立时间和文件传输速率等。利用NQA的分析结果,用户可以及时了解网络的性能状况,针对不同的网络性能进行相应处理,还可以对网络故障进行诊断和定位。启动NQA测试组后,每隔一段时间发送一次报文进行测试,测试的时间间隔根据需求来设定。在RRPP环网结构中,需要首先保证RRPP的保护功能。因此,间隔时间一般比RRPP的报文检测时间要长。一次NQA测试由若干次连续的探测组成,探测次数也可自行定义。

图2为一个RRPP环网结构。其中,S5800-3为环网中的主节点,GE_0/1为其主端口,GE_0/2为其副端口,其余节点为传输节点。在主节点制定NQA策略,定期发送探测报文,探测至S5800-2是否可达。若策略失效,则强制将副端口GE_0/2关闭。

在无故障情况下,RRPP环路正常,主节点的副端口GE_0/2为阻塞状态,数据按逆时针方向传输探测报文到达S5800-2。当发生故障时,RRPP和NQA将共同作用保障环网安全。这里所指的故障主要分为以下两种。

链路中断:当环网中某条链路发生中断或者设备故障时使环网出现中断现象。此时,首先触发RRPP环网保护,主节点的副端口被打开,数据流量改为顺时针方向,通信正常。NQA报文能顺利到达S5800-2,不会触发联动机制。

环网丢包:这是本文重点讨论的问题。当环网中由于物理链路或设备转发出现问题造成丢包情况时,会出现概率性地丢弃探测报文的情况。若丢弃的是RRPP报文,则会触发RRPP环网保护,主节点将副端口打开,此时环网将形成环路。发生广播风暴。当发生广播风暴后,将影响环网上的业务,此时NQA的探测也将失效,触发联动机制将主节点的副端口关闭,环网消失,广播风暴逐步恢复。当丢弃的报文为NQA报文时,则主动将副端口关闭。由于副端口被强制关闭,即使RRPP检测到环网链路中断也无法主动打开副端口,因此也能避免发生环路。需注意,无论丢弃的是RRPP报文还是NQA探测报文,丢包问题都需要网络管理员通过其他手段排查。本文讨论的方案主要是防止环网产生环路造成业务中断。

3 测试验证

测试验证的主要目的是验证当环网产生环路后自动修复功能的效果。测试设备采用华三的9508E和S5800交换机,各设备按照图2的网络拓扑进行连接,环网中运行RRPP协议。S5800-3为环网中的主节点,GE_0/1为其主端口,GE_0/2为其副端口,其余节点为传输节点。RRPP的控制VLAN为4092。在S5800-3和S5800-2设备分别配置VLAN 200,并配置IP地址2.1.1.1/24以及2.1.1.2/24。在S5800-3上配置NQA策略,对S5800-2上VLAN 200的地址2.1.1.2/24进行探测,探测间隔为1 s,远大于RRPP的Hello包的探测间隔。同时,配置TRACK策略,关联上述的NQA策略。当NQA监测失效,将会自动关闭S5800-3的GE_0/2端口,避免环路。

初始状态下,RRPP环路状态正常,NQA策略状态正常,如图3所示。

为测试效果,将9508E上两个中继口的VLAN 4092关闭。此时,RRPP探测Hello包无法通过,RRPP将启动保护功能,自动打开其从端口,但其他VLAN业务正常,因此整个环网将形成环路。产生环路后,将引起广播风暴,整个环网的业务受阻,如图4所示。此时,NQA探测也将失效。

S5800-3自动将GE_0/2端口关闭。此时,RRPP主节点的副端口为DOWN,环路消失,业务恢复,如图5所示。

将9508E的VLAN 4092放通,打开S5800-3的从端口GE_0/2,RRPP探测正常,整个网络恢复正常,如图6所示。

通过测试,故障发生时,配置NQA策略的RRPP环网和未配置NQA策略的环网保护能力,如表1所示。通过在RRPP环网结构中配置NQA策略,能在环网丢包的状况下避免广播风暴。一旦发生广播风暴,则能在1 min内快速完成修复,从而有效地提升了网络的安全等级。

4 结 语

RRPP作为成熟的环网保护技术,故障发生时能迅速进行路由切换,有效规避网络单点故障对整个网络产生的影响。但是,当发生极端故障时,会影响到RRPP的Hello包传送,导致RRPP机制异常,可能引起整个环网的广播风暴,这样势必会对环网业务带来巨大影响。而在RRPP环网中加入NQA探测,对链路状态、网络质量进行监测,并关联相关策略,能有效弥补RRPP机制固有的不足,从而增强网络的安全性。

参考文献:

[1] 沈铭,郑毅聪.基于光子集成技术的城域OTN组网应用方案[J].电信技术,2016(06):75-79.

[2] 廖一明,廖海洲.RPR技术在高速公路通信系统中的应用研究[J].湖南邮电职业技术学院学报,2015,14(02):12-15.

[3] 吴军民,张小建,吴鹏.电力专用工业以太网环路保护技术研究[J].电力系统通信,2012,237(33):27-30.

[4] 周伟,陈兵.基于VxLAN的运营商二层以太网演进方案[J].电信技术,2016(09):56-60.

[5] 张届恩.STP技术及其组网应用[J].有线电视技术,2017(06):49-53.

[6] 吴韬.基于RRPP技术的以太网组网应用[J].电子技术与软件工程,2015(09):28-29.

[7] 胡乔林,赵国林,刘剑豪等.iBGP与集中式路由收敛时间分析[J].计算机科学,2015,42(6A):266-270.

[8] 薄杨,黄存东.RRPP+IRF网络冗余保护策略研究[J].桂林航天工业学院学报,2018(02):178-181.

[9] 王斌,王文鼐.高性能电信级以太环网保护[J].北京邮电大学学报,2013,36(05):71-75.

[10]何涛,徐京渝.巧用NQA联动解决故障[J].网络安全和信息化,2016(07):87-88.

[11]崔潇宇,沈庆国.MPLS网络中基于QoS约束的路由和准入控制[J].通信技术,2018,51(06):1334-1337.

作者简介:

金 豪,上海市信息网络有限公司工程师,学士,主要研究方向为数据通信、互联网技术。

(本文选自《通信技术》2018年第十一期)

原创声明 >>>

本微信公众号刊载的原创文章,欢迎个人转发。未经授权,其他媒体、微信公众号和网站不得转载。

···························································返回搜狐,查看更多

责任编辑:

rrpp协议如何修改_【网安学术】基于NQA策略的RRPP优化机制相关推荐

  1. rrpp协议如何修改_华为交换机―RRPP协议

    1.RRPP协议基本知识: a)概念:快速环网保护协议:RRPP专门应用于以太网环的链路层协议,可以防止数据环路引起的广播风暴,当一条链路断开时能迅速启用备份链路恢复网络节点之间的通讯. b)RRPP ...

  2. rrpp协议如何修改_华为交换机—RRPP协议

    1.RRPP协议基本知识: a)概念:快速环网保护协议:RRPP专门应用于以太网环的链路层协议,可以防止数据环路引起的广播风暴,当一条链路断开时能迅速启用备份链路恢复网络节点之间的通讯. b)RRPP ...

  3. rrpp协议如何修改_产品技术-RRPP技术介绍-新华三集团-H3C

    RRPP简介 RRPP(Rapid Ring Protection Protocol,快速环网保护协议)是一个专门应用于以太网环的链路层协议.它在以太网环完整时能够防止数据环路引起的广播风暴,而当以太 ...

  4. rrpp协议如何修改_《技术进阶:理解RRPP协议.ppt

    理解RRPP协议 RRPP 协议的背景 RRPP协议是由EAPS协议发展来的, EAPS (Ethernet Automatic Protect Switching) EAPS协议:rfc3619 对 ...

  5. matlab中dcsk,【网安学术】煤矿井下MIMO-CD-FM-DCSK通信性能的分析

    原标题:[网安学术]煤矿井下MIMO-CD-FM-DCSK通信性能的分析 摘要:针对煤矿井下无线通信环境的复杂性和特殊性,将MIMO技术与CD-FM-DCSK混沌键控通信系统相结合进行可行性研究.以2 ...

  6. 滑动差分倒谱系数 matlab,【网安学术】基于音频特征参数的多语种分类算法

    原标题:[网安学术]基于音频特征参数的多语种分类算法 摘要:伴随着国际化的趋势,音频语种识别问题越来越受到重视.但是,现有的语种识别系统不能满足现代化日益增长的需求.处理小语种和混淆度高的语种分类时, ...

  7. 起伏地表matlab,【网安学术】短波通信中地表反射损耗的分析和建模

    原标题:[网安学术]短波通信中地表反射损耗的分析和建模 摘要:在短波通信过程中,地表的物质组成不同和地形起伏会导致电磁波在地表反射时产生损耗,同时反射角度发生巨大变化.针对地形变化的不同情况,建立基本 ...

  8. rrpp协议如何修改_RRPP快速环网保护协议

    全球电信业正面临着严峻的挑战.VoIP的冲击使传统话音业务收入的比重持续下降:IPTV的兴起导致带宽数十倍增加而视频业务的收费价格却在降低:数据业务的增长明显趋缓.运营商面临业务转型和大幅降低成本的考 ...

  9. rrpp协议如何修改_RRPP(快速环网保护协议)

    RRPP(Rapid Ring Protection Protocol,快速环网保护协议) RRPP技术是一种专门应用于以太网环的链路层协议,它在以太网环中能够防止数据环路引起的广播风暴,当以太网环上 ...

最新文章

  1. 告诫那些有创业梦的大学生,切记千万不要盲目创业!
  2. tableView 删除一行后下一行点击事件被忽略
  3. [BJDCTF2020]EzPHP 1
  4. php数组循环0到32,通过数组php循环
  5. 第一个SpringBoot入门级项目(超详细步骤)
  6. VTK:图片之RGBToHSV
  7. thinkphp当前php路径,分析thinkphp常见路径用法分析
  8. JMP指令转换公式推导
  9. ariel字体_播客第58集:软件开发人员和freeCodeCamp超级巨星Ariel Leslie
  10. C#下2\10\16进制互转代码总汇
  11. 这个超时问题花了我两周才解决!
  12. shiro访问html没有验证码,Shiro在web应用中实现验证码、回显登录失败信息
  13. Python爬虫开发【第1篇】【正则表达式】
  14. 数组操作--微信小程序学习教程 1
  15. python 时分秒相加大于24h_在python中,将24小时加到负时间差上
  16. 局域网下两台电脑ping不通的问题
  17. word excel如何用印章生成器软件在线制作电子印章 电子公章图片
  18. 苹果怎么用微信链接服务器,苹果手机如何设置微信登陆锁
  19. \xmemory(102): error C4996: 'std::uninitialized_copy::_Unchecked_iterators::_Deprecate':
  20. 特征频率、最y大振荡频率、截止频率有什么关系和异同

热门文章

  1. 用力和应变片计算弹性模量_利用应变片测量金属弹性模量
  2. 文献翻译:Social LSTM: Human Trajectory Prediction in Crowded Spaces
  3. mysql事务 mysql事务回滚 MySQL事务死锁 如何解除死锁 资金出入账
  4. uniapp 聊天记录插入的两种方式
  5. UVA340紫外线灯管
  6. 辩证法三大规律和五大范畴
  7. 研究生了,你会查文献吗??这里能会有所帮助
  8. 你怀疑过“温水煮青蛙”的故事吗
  9. 函数式编程:一等函数(First-class Function)
  10. 前端学习之路CSS基础学习二