关键词:
梯度提升决策树
计算机
网络
异常流量
识别
摘要:
计算机网络流量数据具有复杂结构和多变性的特点,传统方法难以直接、准确地捕捉并识别出异常流量特征的真实概率分布关系,从而导致异常流量识别的准确性降低。为了克服这一难题,提出基于梯度提升决策树的计算机网络异常流量识别方法。首先,计算基线向量差值以量化正常流量与潜在异常流量之间的差异,并据此初步确定哪些流量数据可能属于异常。利用隐马尔可夫模型对这些潜在的异常流量进行时序特征概率分布关系的分析,并在考虑业务行为的基础上提取异常流量时序特征。然后,引入DIP深度包检测技术,锁定这些异常流量的源IP地址。最后,利用梯度提升决策树(GBDT)构建多个弱学习器,并结合叉熵损失函数来指导模型的训练过程。在训练过程中,GBDT会从流量数据中学习并提取特征(包括DIP技术锁定的IP地址等),构建出一个能够准确分类异常流量的模型。实验结果表明,所提出的方法在异常流量识别方面的平均准确率达到96.60%,平均查全率为96.99%,而平均漏报率仅为0.18%。这些结果表明,所设计的方法具有较高的识别效果和良好的应用性能,能够有效应对计算机网络中复杂多变的异常流量。