本文版权为《邮电设计技术》所有,如需转载请联系《邮电设计技术》编辑部
摘 要:传统信令分析方法需要专业人员找出可能与失败码相关的聚集的信令字段值或值组合及其导致失败的概率,并定位网络问题,操作复杂且效率低。通过改进Apriori关联规则算法,将探寻聚集的字段值或其组合的过程转换成发现失败码和相关信令字段值的关联规则。在计算频繁项集时,通过设置最小支持度阈值找出包含失败码的频繁项,将待分析失败码作为后项,减少了算法的复杂度和算力要求,并通过置信度和提升度找出与后项强关联的属性,实现了对失败码集中属性的快速高效识别。
关键词:信令分析;关联规则;Apriori算法
doi:10.12045/j.issn.1007-3043.2024.09.011
概述
信令记录是通信网络中用户与网络交互的主要信息源,包含了许多关键的操作参数和状态信息。传统的信令分析方法通常通过对信令记录的某些字段进行深入分析,找出产生失败码的集中属性,进而定位和诊断网络问题。信令记录一般会包括用户相关信息(如MSISDN、IMSI)、终端相关信息(如终端IMEI、终端 TAC 等)、设备相关信息(如设备编码等)和结果相关信息(如成功、失败及失败码等)等字段,信令分析的主要目的是找出失败原因,定位出与失败相关的字段信息(如某些号码段、某些终端或某个设备)。
针对某个失败码的分析,传统的做法是:第 1 步,先筛选包含该失败码的记录,从中选取对失败码具有潜在关联的特定字段或字段组合(如用户号码、终端类型、接入设备、APN、核心网设备编码等),然后计算所选特定字段的值或字段组合的值组合是否有聚集趋势,最后获取有聚集趋势的字段值或值组合;第 2步,计算所选字段值或者值组合是否与该失败码强关联,即在全部记录中查询包含所选字段值或值组合的记录,计算该失败码发生的概率,概率越高,说明所选字段值或值组合越可能是导致该失败码的主要原因。这个过程中最困难的是字段组合的选择,选择正确时可以很快找到与失败相关的值组合,从而发现问题,但是由于信令记录字段众多,字段组合的复杂度高,而且不同字段的值变化多样,导致目标失败码的值组合很难被发现,需要丰富的专家经验进行判断。对比数据挖掘中的关联规则算法[1-2],可以发现这个过程本质上就是发现信令记录中含失败码的强关联规则。本文从 Apriori关联规则算法出发,简单阐述了算法逻辑,并结合实际信令分析过程进行算法改进,从而实现高效自动化的信令分析。