网络KPI(Key Performance Indication)即网络关键性指标,是对网络所能实现的端到端性能的直观描述。中国联通研究设计院工程师田元兵指出:“KPI指标量化反映了网络性能,与用户感受息息相关,因此提升KPI有助于提升用户感知度,对打造WCDMA精品网络具有重要实践意义。”
KPI涵盖网络覆盖、质量、性能、资源利用率等各个方面,并按照不同的网元和网段有着非常明晰和结构化的层次关系,高层KPI和端到端KPI由一系列底层KPI通过一定的加权求和算法提取。“KPI的准确解析事关统计的准确性以及利用KPI定位问题的精度。”中国联通研究设计院研发部无线一室室主任黄志勇认为,KPI是进行网络优化、提高网络质量的基础,有些KPI指标直接反映网络性能问题;有些KPI为网优问题的解决提供辅助参考,并可评估网络问题是否得到解决。
从不同角度,KPI分类不同,如网络KPI和产品KPI,无线网KPI和核心网KPI,日KPI和月KPI等,通常KPI指标应具备可测性、可比性、完整性、普适性。按照网络阶段,KPI可分为工程优化KPI和运维优化KPI。其中工程优化是在网络建设完成后、放号前进行的网络优化,其主要目标是让网络能正常工作,同时保证网络达到规划的覆盖、干扰及业务性能目标,使网络性能KPI达到放号条件。黄志勇告诉记者,WCDMA由于对端到端性能和网络真实体验的关注,除常规的覆盖类,容量类和资源类指标,还出现了对于承载业务的接入性、保持性的评估,这一类指标更加突出对业务性能的关注,使得对于业务本身业务质量的评价成为可能。但要实现对真实用户体验的评估,目前的KPI指标体系还需要很多完善工作。
一、设备运行类
基站退服率指标主要受基站退服个数的影响。基站退服一般由两种情况组成:一是该站点在一段时间内只有一次退服,可能受传输割接,传输调整,基站停电等方面的影响。这种情况在无线侧基本没有什么有效的手段来解决,传输设备占了主要因素。第二种情况,同一个站点在一天内多次退服。一般情况,基站退服告警伴随其他两种告警同时发生。
基站完好率指标表明可以进行优化测试的站点数量占站点总数量的百分比。需要重点关注的告警是“小区退服告警”,当一个站点的所有小区都正常时,该站点才具备测试条件。这一部分需要重点关注两部分,一部分是实时告警中的小区退服,由于实时告警是未恢复的告警,所以实时告警中退服的小区完全无法正常工作,直接影响优化测试以及基站的正常使用。另一部分是历史告警中的小区退服告警。历史告警中,有的站点可能在一周内出现几分钟的小区退服告警,一般由于天气、传输、供电等外部因素引起,无法解决,需要关注的是些一天中频繁出现小区退服的站点,这部分问题大部分由于传输、工程质量或硬件质量引起。
二、覆盖类
RSCP是指UE接收到的信号经解调、解扰和解扩后,得到的特定码道功率。WCDMA系统中CPICH以特定功率发射,发射功率大小与负载无关,因此通过测量RSCP可对终端和NodeB间的传播损耗进行定量分析。RSCP大小可粗略判断目标区域覆盖情况,如CPICHRSCP<-95dBm的区域,可直观认为可能存在弱覆盖问题。
但RSCP并不能完全反映小区的实际覆盖情况,需结合Ec/Io指标综合判定。Ec/Io是码片能量与干扰和噪声比值,CPICHEc/Io表征了接收导频信号质量,同RSCP指标一起作为下行覆盖的判断依据。WCDMA属自干扰系统,Ec/Io指标与网络负荷有直接关系,网络下行负荷越重,同一定点Ec/Io越小。WCDMA可支持多种不同速率的PS和CS域业务,不同业务对导频信号强度和质量要求不同,速率越高要求越高。影响Ec/Io指标的主要因素有切换问题,导频污染,内部和外部干扰问题,网络负荷高等。
UE的发射功率反映了终端当前上行链路的损耗水平和干扰情况,是描述网络上行覆盖水平的基本指标,上行链路损耗越大干扰越大,终端发射功率越大。要保证上行覆盖,UE发送功率值须小于其最大发送功率值。
覆盖优化常见场景和优化手段包括:(1)过覆盖问题:通常由高站引起,可采取压下倾角方式,此举可控制扇区覆盖范围抑制过覆盖,同时也可缓解“灯下黑”状况。(2)弱覆盖问题:可调整方位角、下倾角、挂高及更换天线,但在调整或更换天线时一定要顾及原来并非弱覆盖的区域。(3)波导效应和拐角效应优化:通常由扇区方向正对着路口引起,现象是在天线正对街道上信号强度很强,且能覆盖很远,但道路一旦拐弯,信号就会突降,引起掉话等质量问题。通常采用调整天线方位角方式,使天线与道路方向保持合理夹角。
链接:弱覆盖案例
【问题描述】路测发现,二中基站三扇区周边RSCP值较低,在-90dbm左右。
【解决思路】首先确认第三扇区是否存在遮挡,其次排除硬件故障或参数设置问题,再次考虑是否存在弱覆盖问题。
【问题分析】检查发现,该站点扇区无遮挡,软硬件均工作正常,但因安装条件受限,三扇区馈线较长,损耗较大,属弱覆盖问题。
【解决方法及效果】考虑通过更换馈线和天线来解决,将现有天线由65度15dBm替换为90度18dBm,并将三扇区的天线方位角由240度调整为220度,问题得到改善。
三、接入类
接入类指标反映了整体网络的可用性,可分为CS呼叫接通率和PS呼叫接通率,并可按业务进一步划分,每一种业务又分为主叫和被叫,该类指标直接关系到用户的使用感受。
(1)语音接通率
反映RNC或者小区的UE接纳能力,是指从终端上行发起到“RRCConnectionRequest”到接收CN下行直传“Alerting”的成功概率语音接通率,定义为:接通总次数/试呼总次数×100%。在WCDMA系统中,导致呼叫失败的原因很多,从呼叫信令来看,重要的过程有无线接入、无线链路的建立、无线承载的建立、无线承载的重配、传输信道的重配、物理信道的重配以及RAB的指派等过程。如果无线链路建立的成功率较低则说明无线环境较差,如果无线接入成功率、RB建立或重配的成功率以及RAB指派的成功率较低则说明网络资源不足等。
(2)VP接通率
VP接通率的定义与语音接通率相同,不同之处在于业务速率的不同,两者接通率通常也不相同。
(3)PDP激活成功率
PDP激活请求次数有两种定义:①手机发起RRCConnectionRequest(原因值为主被叫的交互和背景业务)的次数,②手机发起ActivatePDPContextRequest的次数。通常采用①。
四、保持类
用户终端在网络中移动,此过程中如果业务不能保持连续性,则发生掉话。UMTS网络的优化通常关注语音业务掉话率、视频电话掉话率和数据业务掉话率指标。根据指标获取途径的不同有所区别。路测得到的掉话率通常指业务里程掉话比,是由少量终端在某条测试路线上得出的结果;网管统计得到的掉话率是统计时段内所有统计对象的结果。常见的掉话原因包括:网络覆盖差掉话、邻区漏配掉话、扰码复用冲突掉话、切换掉话、干扰掉话、网络异常原因掉话等。
降低掉话率主要从三方面入手:一是调整网络工程参数。这是工程优化的工作重点,目的是调整网络覆盖,在保证信号强度的同时尽可能减小干扰。主要调整手段有天线方向角和下倾角、天线摆放位置、天线类型、基站发射功率、天线挂高、站点位置、覆盖增强手段和新增站点。二是调整网络无线参数。影响掉话率的无线参数非常多,通常都包含切换(软切换、频间硬切换和系统间切换)相关参数、功控相关参数,以及邻区配置。三是调整与掉话相关的定时器和计数器。
链接:掉话率优化案例
【问题描述】海外某商用局一小区的掉话率始终在3%左右,且无硬件告警信息,小区主要覆盖海面,位置如下图所示,该小区为图中的红色小区。
【定位过程】通过路测及网管中的测量数据,利用ZTEZXPOS优化工具CNA及邻区优化工具NCOS,对有切换关系的小区及切换次数的多少,进行排序,来对邻区进行优化。
【解决方案】增加切换次数大于200次的小区作为邻区,并逐个认真核对每个扰码的实际切换小区。
【优化效果】更改邻区后,CS掉话率由3%左右下降到0.58%左右。
五、移动性类
移动性类指标,主要是切换性能指标。对于WCDMA系统,切换种类较多,包括软切换、频间硬切换及系统间硬切换。工程优化期间,主要考虑软切换和系统间切换。通常,3G网络运营初期,核心覆盖区域相对GSM的成熟覆盖要小些,此时需要借助系统间的互操作,实现业务的连续覆盖,为用户提供良好的使用感受。此时2G/3G网络之间的切换是需要关注的优化重点之一。
软切换成功率=软切换成功次数/软切换请求次数×100%。切换失败的问题一般在于切换区的长度和切换区里各个信号的强弱变化情况。影响软切换成功率的主要因素有切换区过小、邻区漏配、切换参数设置不当、RF优化、邻区优化等。
系统间切换性能优化的思路和方法与软切换基本相同,主要也是从切换区、邻区、无线参数几个方面着手。不过对于系统间切换来说,由于可能涉及不同的设备供应商之间的协调,以及不同版本、不同网元之间的对接,其优化考虑的因素相对来说会多一些。
链接:系统间切换性能优化案例
【问题描述】香港项目中,从锦上路到荃湾需经过大榄山,大榄山共有两条隧道,两条隧道中都没有3G覆盖。需要为覆盖隧道口附近的3G站点配置GSM邻区。这种场景下,用户从隧道外的3G覆盖区域进入2G覆盖区域的速度都很快,因3G向2G切换失败而引起的掉话较多。
【定位过程】通过路测及网管后台的信令族,发现主要是因为UE的移动速率太快,在3G信号快速衰减的情况下,来不及完成启动压缩模式,从而引起掉话。
【解决方案】针对信号的变化情况,提高3G到2G切换启动压缩模式的门限,即2D/2F的RSCP门限。
【优化效果】针对不同的2D/2F门限,对应掉话KPI变化情况为:2D/2F=-115/-106,掉话率17%~19%;2D/2F=-95/-85,掉话率2%~3%;2D/2F=-90/-80,掉话率1%~1.4%。所以2D/2F=-90/-80这套参数对于这种场景较适合。同时对于这套压缩模式参数,如果系统间切换采用3A事件触发,相应3G系统的切换门限需调整,当然也可采用3C事件触发。
六、业务质量类
呼叫时延是影响用户使用CS业务的主观感受的主要指标之一。从用户角度,希望这个指标越小越好,因此对时延性能的判断是带有一定主观性,实践中按普遍接受的时延水平作为优化目标即可。从信令流程上来看,所统计的时延是主叫从发起RRCCONNECTIONRE-QUEST到UE收到Alerting消息的时延。
1)呼叫时延的优化
RRC阶段从以下几方面考虑优化:PRACH前导功率攀升步长、攀升周期、重传次数、初始发射功率修正常量等,需综合考虑接入时长和接入过程所产生的干扰;RRC消息超时设置和重传次数,即T300和N300的设置;小区重选的速度优化,避免小区重选不及时所造成的RRC多次尝试;优化网络覆盖情况,避免在覆盖弱区起呼。对于寻呼阶段,从以下几方面考虑进行优化:PCH和PICH的功率设置优化,若设置偏低,会导致寻呼消息重发,加大接续时延;不连续接收循环长度系数DRX的设置;开启预寻呼。其他方面可以考虑的优化因素有:考虑关闭鉴权、加密等流程;采用高速信令。
PS业务呼叫时延优化与CS业务优化的思路类似,通常仅考虑RRC阶段的时延优化,不涉及寻呼阶段的动作。在PS核心网(SGSN、GGSN)侧,创建PDP上下文的时间通常与设备相关,且较难优化。仅在特殊情况下加以考虑。
2)PS业务下载速率的优化
PS性能差从吞吐率测量上看表现为速率不稳,大范围波动,以及速率低等问题。从业务质量的角度,反映在流媒体图像质量不清晰、有缓存,FTP下载时间长,浏览网页反应速率慢等。PS数据主要经过Internet业务服务器,GGSN,SGSN,RNC,NodeB后到达UE,中间经过Gi、Gn、IuPS、Iub、Uu五个接口。此过程中,Internet服务器到GGSN走IP协议,在两者之间还可能存在一个或若干个路由设备以及防火墙之类的设备。因为环节众多,因素复杂,所以其优化相对来说较为复杂。出现问题以后,首先查看是否有设备告警。RAN侧查NodeB、RNC的告警,CN侧查SGSN、GGSN、LANSWITCH、ROUTER等网元的告警。时钟异常告警、传输误码、设备异常等告警均有可能影响下载。如果从网元的告警不能确定问题所在,下一步进行一些操作类对比和分析,尽量从众多的影响因素中划分出问题所在的大致范围。如果大致确定该PS下载问题为RAN侧问题,转到RAN侧下载问题分析;如果大致确定该问题为CN侧问题,则转到CN侧下载问题分析。
链接:RF覆盖影响PS下载速率优化案例
【问题描述】网规网优工程师发现某RNC下的HSDPA下载速率偏低,并且很不稳定。
【定位过程】通过地图发现该站点与另一个站点距离较近。此外通过ZTE的网络测试优化分析工具ZXPOSCNT和CNA,可以发现该地点存在很严重的导频污染。
【解决方案及效果】通过无线优化解决导频污染问题,使HSDPA下载恢复正常,可达6Mbps左右。
