2015-8-11 11:43

海南移动探索全网集中化故障管理

网络规模快速扩张,网元数目和种类不断增多,网络架构和业务流程日趋复杂,在日均告警量达到80万以上的情况下,海南移动监控人员要想通过传统的监控方式从众多告警中及时定位故障变得越来越难。同样,根据告警进行故障监控的管理模式过于粗放,亦无法更好地满足客户对通信感知的要求。为此,海南移动在故障监控、处理及网络优化的流程上进行了全面革新,充分利用信息化管理手段实现了集中化故障管理的运维模式,快速、高效地解决移动通信网络中的故障。

亮点一:实施分级监控管理,提升故障调度效能

为了及时发现故障,精准定位故障点,海南移动对监控员的工作模式进行了调整,将全省所有基站分成南北两个区域,传输网分为汇聚层与接入层两个监控平面,进行分级管理。废止了全部代维单位的值班电话,统一使用一个电话入口,设立两个故障处理、3个故障配合以及1个工单转派岗位。这样,汇聚层的故障有了专人把控,避免接入层大量故障影响到汇聚层的监控工作,以确保重要故障被及时发现,报障及时率从89.86%提升至100%。

亮点二:改变传统派单模式,提高故障工单处理效率

海南移动建立了全新的工单直派、告警预处理、语音督办、工单回复、工单质检等集中化故障管理的流程,稳步推进全网工单直派一线进程,共完成20万条网元映射关系规则、530个工单角色组、92条自动转派规则、91条语音督办规则、98条质检规则、118种派单规则、26种告警关联规则的梳理及应用。同时,开展周月维度的工单分析、典型案例分析、故障处理经验总结,确保了全网告警实现自动派单、全网工单直派一线,实现了集中化故障管理改革既定的工作目标。

亮点三:统筹全网运维,实现故障管理的手段变革

首先,开发手机运维平台,从故障处理、资源勘查、告警查询及投诉处理等方面,为一线维护人员提供快速、便捷的支撑手段。目前,该手机运维平台已经发布了异常监控、资源随手搜、告警查询、故障工单、投诉工单、故障统计等App,同时接入了代维系统、综合资源系统的App,有效支撑了一线维护工作需要。其次,新建故障管理系统,海南移动的故障管理系统实现了告警监控、场景监控、拓扑监控、性能监控、系统自管理、资源勘误、GIS定位等功能,目前已实现138703个各类网元的接入,基本实现了全专业告警接入和资源接入。最后,引入智能外呼系统。改变传统人工电话通知低可靠、低效率的响应及管理模式,实现了故障、告警的自动语音通知、督办、升级等全生命周期管理,使得告警响应更加及时准确。

亮点四:建立管理视图,实现信息展示与分享

海南移动在电子运维系统中实现了部门视图、地市视图、人员视图等创新监控手段,以直观的可视化方式为各级管理者及分公司提供工单处理情况的展示和监控,同时让分公司掌握所管辖市县当前的网络健康情况,支撑市场业务发展,并打通智能外呼系统与经分系统接口,通过智能外呼功能以字段拆分的方式,实现故障信息共享,将重要故障信息通过经分系统呈现给分公司,为分公司发展客户市场提供强有力的保障。

亮点五:自主研究漏告警保障程序,建立告警直线保障机制

海南移动集中化的改革促进了综合网管与设备网管(OMC)之间存在漏告警、漏告警清除问题的解决,在与相关设备厂家确认安全的前提下,开放OMC告警数据库,通过程序自动比对OMC与话务网管侧告警的方式核查漏告警,对告警进行重新采集。告警采集定时查询OMC间隔及告警范围均可以设定,降低对OMC的负荷影响。

亮点六:推动管理办法落地,严格把控故障处理成效

故障从产生到归档,全流程需要规范化管理,故障工单的派发涉及派单规则、督办规则、维护映射规则等,为此,海南移动进行了全流程规则备案,实现故障派单的规范。工单的处理需要一线维护员对工单进行及时响应处理,公司为此制定了网络代维故障考核管理办法,督促并考核代维部门及时处理工单,实现工单处理的规范。为了避免随意处理工单的现象,还编制了集中化故障工单处理指导文档,同时定期进行工单质检,对不合格工单进行通报,提升故障处理的快速响应速度及故障处理质量。

作者:欧燕燕   来源:人民邮电报

相关

网络信息化移动通信基站手机
本评论 更新于:2025-12-15 11:47:48
在C114 APP中与业内人士畅聊通信行业热点话题!