关键词:
强化算法
网络安全
混淆攻击
摘要:
增加网络传输数据的稳定性是当下网络发展的方向,如何提升网络混淆攻击防御的成功率,提高信息输送、用户隐私等的安全性具有重要意义。为提高防御模型的响应计算时效性,本文将MDP决策算法与RL强化学习网络有机结合,建立了改进强化学习网络混淆攻击防御模型。该模型首先对折扣因子进行强化,通过奖励数据加权计算,在增加智能体动作的基础上,对传统MDP决策算法进行优化改进;然后通过提升动作管理的即时奖励,在持久奖励为目标的基础上,采用MDP决策出最优动作,同时利用损失模型解决设备增长的问题;接着采用MCM算法进行网络求解,通过系统采样处理与梯度函数反推的方式,使得估计期望回报趋于状态价值,以提升改进RL防御模型的响应时效性;最后设置SSID网络混淆攻击对系统模,通过游戏攻击模型验证防御算法的成功率。网络数据传输仿真实验结果表明即使随着传输并发数据容量与数量的增加,本文改进防御模型的响应时效性较高,较其他三类传统防御模型相比,本文模型的开销时间增量最小;混淆攻击网络防御仿真实验的结果反映出,与无防护网络模型相比,改进RL网络防御模型的防御成功率平均增加了41.10%,且较MAC、DAC与MD5三类网络防御模型相比,RL防御网络模型成功率整体增长了12.95%。即本文提出的改进强化学习网络防御算法的响应速率快、防御成功率高,在网络信息安全研究中具有较为重要的仿真分析价值。