本发明公开了一种基于深度强化学习的作战策略优化方法及系统,该方法包括:构建高超声速滑翔弹模型,确定导弹的当前状态;构建神经网络模型,神经网络模型的输入为突防环境,输出为动作集;根据突防环境,基于神经网络模型,得到预测动作集;根据当前状态以及预测动作集,计算导弹的下一步状态并更新高超声速滑翔弹模型;采用Minimax算法计算敌方状态;根据下一步状态以及敌方状态计算奖惩函数;根据奖惩函数优化神经网络模型;基于优化后的神经网络模型得到最优作战策略。本发明具有短距离精确操作和长期规划预测的能力,推演效果符合预期,同时其具有较强的实时决策能力,可以很大程度的提高突防成功的概率,可作为滑翔弹突防的决策依据。
声明:
“基于深度强化学习的作战策略优化方法及系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)