关键词:
制导律
落角约束
深度强化学习
有限视场角
微型制导弹药
摘要:
为满足日益复杂的作战需求,提升微型制导弹药在近距离下的制导性能,基于深度强化学习(Deep Reinforcement Learning,DRL)提出一种考虑视场角极限的落角约束制导律。推导导弹相对移动目标的落角误差估计公式,以落角误差和视角为状态量并构造分段奖励函数,将制导问题建模为时间离散的马尔科夫决策过程。通过偏置比例导引获得所需制导指令,并由DRL的策略网络输出其偏置项,通过近端策略优化算法对网络进行训练,得到最优制导策略,实现在无弹目距离信息下对视角和落角的约束。在不同视场角限制、期望落角、目标速度、初始位置和导弹速度下进行数值模拟和蒙特卡洛仿真,并对导弹在不同速度下的捕获区域进行对比分析。研究结果表明,所提制导律在不同初始条件下均能保持良好的制导性能,在近距离打击中相比现有制导律具有更大的捕获区域,在干扰作用下具有更小的落角误差分布,从而验证了该制导律的有效性与优越性。