关键词:
云化资源池
故障定位
告警聚类
贝叶斯疑似度
摘要:
随着网络云化进程的快速发展,通信组网架构越来越复杂,传统基于固化经验的网络运维方式弊端逐渐凸显。如何提高面向海量告警的网络运维效率,缩短故障处理时长,成为当下研究的热点。本文通过解析云化资源池日常监控运维工作的流程及痛点,结合资源池空间资源、故障传播模型(告警发生时间、告警定位字段)等关键信息对资源池故障产生的海量告警进行汇聚,采用特征提取和建模分析方法,基于贝叶斯疑似度的启发式故障定位算法,提出了基于空间资源的网络云故障根因智能推荐方案。经过资源池故障实际案例的实践验证,该方案在日常运维过程中能够快速汇聚故障关联告警,定位故障根因,大幅缩短业务恢复的时长,有效提高网络云运维效率。