2019-10-16 11:11

基于带内检测的Inband OAM技术,为5G承载网保驾护航

5G承载网对传统检测技术提出巨大挑战

5G时代eMBB、uRLLC和mMTC的典型应用场景对承载网络提出了大带宽、低时延、大连接、网络切片、高精度时间同步等一系列的需求。业务种类多样化及网络需求的差异化对于网络业务质量(Service Level Agreement,下文简称SLA)提出了更高要求。运营商为5G新业务提供差异化服务,实现网络增值,如何保障用户的服务体验将是5G承载网面临的一大挑战。

在传统的网络运维领域,基于协议ITU-T Y.1731的OAM技术和基于协议RFC 5357的TWAMP检测技术,在检测帧丢失率、帧时延、帧时延变化和吞吐量等性能参数时,采用发送模拟检测报文的间接测试方式,有着诸多的局限:

首先,传统的采用发送模拟检测报文的间接检测方式,无法保证报文与真实路径一致,OAM报文丢包或乱序均会影响统计结果,不能真实反映网络业务的质量。当网络服务质量劣化超过一定的阈值后才会上报告警、故障,切换到保护路径,实现对业务的保障。

其次,传统信息采集周期为分钟级,无法有效定位毫秒级的时延突变及低概率丢包问题。网络故障定位只能够被动定位,定位周期长、难度大。

中兴通讯作为5G承载网解决方案的引领者,从2015年就开始积极跟踪和推进5G承载网络的标准与规范制定并进行关键技术的研究攻坚。针对5G承载运维需求,中兴通讯引入Inband OAM技术,解决当前OAM技术的不足。基于真实业务的报文,该技术可进行端到端及逐点检测业务的时延和丢包情况,实现对真实业务全网覆盖的“逐包”检测和纳秒级的时延检测,从而保证了用户的服务体验。

Inband OAM检测,为5G承载网护航

Inband OAM技术是基于带内检测原理,提供承载网络业务流的端到端与逐跳性能检测能力,可快速感知网络性能相关故障,并进行精准定界、排障。无需额外插入检测OAM报文,将检测信息(包括检测指令和检测数据)携带在被检测的业务报文中,实现带内的性能检测。

检测机制和原理

1.检测对象

检测对象为业务流,业务流可以根据业务特征信息灵活的定义,包括业务二层特征信息、三层特征信息、四层特征信息等。为了简化业务流标识信息,可以将业务特征信息映射为一个流标识(Flow ID)。业务流可以通过多种方式进行识别,可识别的特征信息包括目的IP地址、源IP地址、DSCP;业务流的识别在PE设备入口完成。

2.丢包检测

图1 丢包检测原理示意图

Inband OAM参考RFC 8321(Alternate-Marking Method for Passive and Hybrid Performance Monitoring),是一种对实际业务流进行特征标记(染色),并对特征字段进行丢包、时延检测的随路检测技术。

丢包检测原理如上图所示:

发送端:按照一定周期对被检测的业务流标记字段交替染色,同时统计本周期发送的业务流性能,并通过上报给管控系统。

接收端:按照发送端相同的周期,统计本周期被检测业务流特征字段为染色的性能,并上报给管控平面。接收端统计的时间应在1~2个周期之间,保证乱序报文可被正确统计。

管控平面根据发送端和接收端上报的被检测业务流的信息,计算周期i业务流的丢包数:PacketLoss[i] = Tx[i]–Rx[i]。

3.时延检测

图2 时延检测原理示意图

Inband OAM的时延检测原理如上图所示:

发送端:每个检测周期对本周期内被检测业务流的其中一个报文进行时延染色,记录该报文的入口时戳t1/t3,并上报给管控平面。

接收端:按照发送端相同的周期,记录本周期被检测业务流时延染色报文的出口时戳t2/t4,并上报给管控平面。

管控平面根据发送端和接收端上报的信息,计算业务流周期i的两个方向的单向时延:Delay[i](in) = t2-t1,Delay[i](out) = t4-t3,单向时延要求发送和接收端部署1588v2时间同步。

对于被检测业务流双向同路径的场景下,管控平面根据发送端和接收端上报的信息,计算业务流周期i的双向时延:Delay[i](double) = (t2-t1)+(t4-t3)。

报文封装格式

发送端在报文进入时识别业务流,为业务流添加相应的Flow ID,Inband OAM交替染色方案使用双标记法,需要L bit和D bit两个标记域。

Inband OAM标签定义为引导标签(FII,32bit)+流指令头(FIH,32bit)两部分。

引导标签为MPLS保留标签值(0-15bit),支持配置,默认值0xC。其TC、S和TTL字段要求符合引导标签的定义(RFC 3032)。

FIH指令头占据一个MPLS标签位,由流标识Flow ID、流Inband OAM指令和流Inband OAM类型三部分组成。

报文封装格式如下图所示:

指令头封装格式

业务流带内性能检测指示标签(FII):

指示标签通过特定保留标签引导。支持前向兼容,格式符合RFC 3032标准。

流指令头(FIH):

流指令头携带带内检测的基本信息,包括流ID、染色指示位等信息:

1)Flow ID:bit0-bit19,用于唯一标识一条业务流,Flow ID需要在检测域内全网唯一。

2)L Flag:Loss Flag,丢包检测染色标记,用于LM(丢包检测)。

3)D Flag:Delay Flag,时延检测染色标记,用于DM(时延检测)。

采用Inband OAM方式,当管控系统下达端到端的检测任务,网络设备采用Telemetry方式上报Inband OAM采样信息(包计数/时戳数据)到控制器,控制器根据上报信息计算出端到端的丢包和时延;逐点丢包和时延,即链路丢包、节点丢包,链路时延、节点时延。可实现故障准确定界、时延、低概率丢包性能检测。

全网端到端性能实时监测,满足多种应用场景

中兴通讯部署Inband OAM实现全网端到端性能实时监控。用户通过管控平台订阅业务流路径网元的统计数据,订阅后设备开始上报统计数据,管控平台根据上报的数据计算丢包和时延并呈现结果给用户,实现5G承载场景中对真实业务流的逐包监控与纳秒级时延检测。

基站到服务器的业务监控场景

如图3所示,基站和核心网之间的业务即南北向业务,一般由两个SR-TE/TP LSP组成,在SPE节点上进行VPN label的交换。

图3 南北向业务应用场景

用户IP业务流从gNB到EPC,用户通过管控系统为IP业务流分配Flow ID,采用源IP、目的IP、协议号、源PORT、目的PORT,以及DSCP来标识业务流,在UPE/NPE节点上开启染色功能并配置染色周期,流路径上的节点配置基于Flow ID统计。

基站到基站的业务监控场景

如图4所示,基站之间的业务即东西向业务,存在以下两种情况:

情况一:环内基站之间的业务,由SR-BE LSP承载。

情况二:跨环基站之间的业务,此时业务需要经过SPE进行交换。由基站到SPE这一段的业务和南北向业务共用SR-TE/TP LSP,SPE之间的业务由SR-BE LSP承载。

图4 东西向业务应用场景

用户IP业务流从gNB到其他gNB,用户通过管控系统为IP业务流分配Flow ID,采用源IP、目的IP、协议号、源PORT、目的PORT,以及DSCP来标识业务流,在UPE节点上开启染色功能并配置染色周期,流路径上的节点配置基于Flow ID统计。

Inband OAM完成现网验证,开启智能化运维之路

2019年9月,中兴通讯在现网完成Inband OAM带内检测新技术验证,证明了Inband OAM技术可为5G承载智能化管控运维提供创新性支撑。

图5 现网试点测试组网(含WDM彩光互联)

在本次验证中,中兴通讯在现网场景下,验证了Inband OAM技术与智能管控系统UME相结合,逐包检测识别网络中的异常,并精准检测每条业务的时延、丢包等性能;实现故障定位,支撑业务快速恢复。验证过程中增加了对毫秒级盘纤距离增加时延监测和0.5%/1%/5%丢包概率等各种网络故障模拟,并测试故障定位和故障恢复能力。测试结果表明,Inband OAM方案对故障实时感知,能够对总共24条S1和跨环X2流量都能精准定位,并通过直观的图形展示丢包/时延指标标识网络故障点,表明Inband OAM技术实现已经成熟。

作为全球领先的综合通信解决方案提供商,中兴通讯与各行业广泛开展合作,面向5G运维管理技术方向持续测试评估,积极推进带内检测技术的商用化进程,为5G承载网打造坚实的技术基础。

来源:C114通信网

相关

网络5G承载网运营商ITU
本评论 更新于:2024-4-19 5:31:49
在C114 APP中与业内人士畅聊通信行业热点话题!