本文版权为《邮电设计技术》所有,如需转载请联系《邮电设计技术》编辑部
摘要:传统的故障分析手段将运维经验固化为故障分析规则或脚本,这种方式针对特定故障模式较为有效,但是无法应对新网络业务、组网变化,一旦规则、脚本需要调整,需投入较大成本进行适配改造,且时效性较差。而人工智能技术在大数据统计、分析、推理、自适应学习上有着先天优势,能快速基于新网络、新业务的变化重训练AI模型参数,给出最佳推荐值。基于此,重点研究了如何利用人工智能提升运营商故障分析能力。
关键词:故障分析;智能分析;人工智能;大数据;网络运维
doi:10.12045/j.issn.1007-3043.2024.06.015
前言
在日常网络维护中,故障分析是最基础、最重要的工作,故障分析结果的时效性、准确性直接影响了故障处理的效率、网络质量及运维成本。如何从海量告警中准确识别出有效故障,做到告警不多、不漏、不错,一直是网络故障监控的痛点。常见的故障分析手段是基于规则的(例如单网元告警合并,或者基于某一区域统计告警数量),但这往往不能满足实际运维诉求,想要实现比较复杂的分析逻辑就要在规则基础上叠加脚本,这类脚本随着网络、业务以及运维要求的变化会越来越复杂,持续开发和维护成本也会越来越高。那么是否能利用AI算法在大数据处理、自适应学习等方面的优势,提升运营商故障分析能力是本文的研究重点。