1、引言

互联网网络上各种增值业务的部署,尤其是互联网电视业务,对互联网网络的可靠性提出了更高的要求。随着网络带宽不断增加,由原来的单边单条链路,增加至两边多条100GE链路,互联网网络链路故障(高误码率,丢包、传输单通等),会导致途径此链路的业务流量大量丢包,甚至中断,从而影响宽带、互联网电视等业务,尤其是组播链路故障,对互联网电视业务影响较大。如何在链路故障时,能够自动将故障链路协议置Down,并将业务自动切至其他正常链路,从而更好保障网络的可靠性,是一个亟需解决的问题。本文主要介绍通过BFD技术来快速检测故障链路,同时联动IS-IS和PIM协议提高互联网网络自愈能力的方法,目的是为了实现网络链路故障时,最大限度降低对互联网业务的影响,尤其是保障互联网电视业务的正常使用。

2、互联网城域网架构及互联网电视高可靠性要求

2.1 互联网城域网架构

某运营商互联网网络分为骨干网、省网、城域网。互联网骨干网作为高速转发平面,实现网间互联和网内互联。互联网省网位于互联网城域网之间,互联网城域网实现网络在城域内的延伸,接入各类用户与业务。互联网城域网提供多种业务在城域内的互联及接入,并且保证各种业务的安全性和服务质量,由城域网核心层(同时也是省网接入层)和城域网业务接入控制层构成。城域网核心层异局址部署两台核心路由器,作为地市的高速IP数据出口,以双上联的口字型结构方式直联成对省网核心设备。互联网城域网业务接入控制层由BRAS和SR组成,用于完成对用户业务的接入认证控制、QoS策略控制和计费统计等功能。某运营商互联网城域网架构如图1所示。

图1 互联网城域网架构图

2.2 互联网电视高可靠性要求

互联网电视业务承载于互联网之上,用户主要通过PON接入网或PTN实现接入。互联网电视组播源可在城域数据网内部通过SR接入,或通过互联网省网接入。组播数据由城域数据网组播树分发至BRAS或SR,然后经过PON接入网或PTN以二层组播方式分发至用户。互联网电视业务属于用户感知敏感性业务,因此对网络的可靠性要求较高。

图2 互联网电视业务接入示意图

2.3应用技术

2.3.1 BFD技术

BFD是一套标准的检测机制,用于快速检测、监控网络中链路或IP路由的转发连通状况。作为一套标准检测机制,BFD可以为多种协议所用。

BFD应用场景:

①当两台设备互联链路之间存在传输设备时,一侧传输设备发生故障,另一侧设备端口无法感知对端链路故障

②对时延较为敏感的业务类型,即使设备间通过裸纤直连

以上两种场景,未部署BFD时,两端设备仅依靠路由协议需要较长时间才能检测到链路故障,将直接导致路由收敛较慢,业务中断时间较长。

2.3.2 IS-IS协议

IS-IS是基于链路状态技术的动态路由协议,能够同时支持CLNP和IP网络层协议。随着多年的发展,IS-IS目前已经成为业界尤其是大型ISP最广泛应用的IGP协议之一。IS-IS协议的基本特点:直接运行于链路层之上、支持IP和OSI两种路由、支持灵活的TLV编址方式,协议扩展性好、支持IP路由收敛速度快,结构清晰,适合大规模网络。

2.3.3 PIM协议

组播路由也称为组播分发树,指从一个组播源到所有组成员的数据传输路径。组播路由单向、无环且路径最短。通过在PIM路由器之间建立和维护组播路由,网络才能够转发组播数据包。PIM-SM(协议无关组播-稀疏模式)可以有效解决大型网络且用户分布比较分散的运营商场景中。PIM-SM只有在主机明确提出需要接收组播数据时,才会构建组播分发树,向提出需求的用户转发组播频道数据。在PIM-SM域中,PIM设备通过周期性的向所有PIM设备发送Hello消息,来发现和维护PIM设备之间的PIM邻居关系。

2.4 BFD与路由协议联动

2.4.1 路由协议联动原理

鉴于承载于互联网网络上的互联网电视业务要求网络具有较高的收敛速度且无法容忍丢包,通过在IS-IS网络中配置BFD特性可解决IS-IS网络收敛速度慢的问题,从而更好的保障互联网电视业务的稳定运行。

BFD和IS-IS协议相关联,BFD的快速性能够在链路出现故障时加快IS-IS协议的收敛速度。但当网络中BFD检测到链路故障,即使故障很快恢复,端口也会因为BFD Down而断连,导致链路不稳定而出现流量丢失。为保证网络的可靠性,解决以上问题,我们有了BFD for IS-IS-cost特性,当IS-IS接口感知到BFD Down时,IS-IS接口自动将该接口的开销值调大,使BFD Down的链路不再被优选,流量可以通过其他链路传输。

在组播应用中,BFD for PIM能够在毫秒级内检测共享网段内的链路状态,快速响应PIM邻居故障。如果配置了BFD for PIM功能的接口在检测周期内没有收到当前DR发送的BFD检测报文,则认为当前DR发生故障,BFD快速把会话状态通告给路由管理模块(RM),再由RM通告给PIM。PIM模块触发新一轮的DR竞选过程,而不是等到邻居关系超时,从而缩小组播数据传输的中断时间,提高组播数据传输的可靠性。

2.4.2 配置思路

首先在两台路由器上启用BFD功能,再为两台设备之间的每个IS-IS接口配置并绑定BFD会话,实现BFD与IS-IS联动。在两台设备互联运行PIM SM协议的接口之间绑定BFD会话,实现BFD与PIM SM协议联动,保证路由协议及组播协议的快速倒换。

3、BFD部署及功能验证

某运营商网络,城域网核心MB至省网核心PB之间主用链路故障,要求毫秒级时间内完成备用链路切换,通过接口下部署BFD功能,验证BFD联动IS-IS和PIM协议链路切换时延。为充分验证BFD配置有效性,在华为eNSP模拟器搭建仿真环境,环境拓扑如图3所示。

图3 环境拓扑图

①验证在MB和PB接口下未开启BFD功能主备链路倒换时延,关闭PB与MB之间串联交换机上行主用链路,模拟传输链路故障。当主用链路中断后,可以看到PB-MB之间的IS-IS协议经过秒级的一个邻居保持时间才出现中断告警,此时视频组播流出现严重卡顿现象,详见图4。

图4 未部署BFD功能验证截图

②验证接口下同时开启IS-IS BFD和PIM BFD功能主备链路倒换测试场景,当主用链路故障时,BFD检测到链路故障,同时联动IS-IS和PIM协议状态置Down,保持了各协议状态一致性,实现毫秒级主备链路切换。客户侧视频出现轻微花屏卡顿现象即恢复正常,详见图5。

图5部署ISIS for BFD和PIM for BFD功能验证截图

4、结 语

BFD可以快速检测网络节点之间的链路故障,为上层应用(如IS-IS、PIM SM)等提供故障检测服务,并提供毫秒级的故障检测时间,通过在互联网网络城域网至省网核心运行IS-IS等协议的链路上部署BFD功能,实现了互联网网络的快速收敛,提升了互联网网络的自愈能力,降低因路由震荡对上层应用可能造成的影响,提高网络的可靠性和服务质量。

作者:王萍

单位:中国移动通信集团新疆有限公司

来源: 中移科协