基于在线增强学习模型的全流程任务时序智能决策方法,第一步,针对红蓝方对抗推演场景,建立增强学习模型,实现面向场景信息的任务时序决策;第二步,采用在线学习异步训练方法对增强学习模型进行强化学习训练,提升训练的鲁棒性和稳定性;第三步,以红方的全流程任务完成概率为基准,通过融合不同的探测与识别弧段得到全局任务完成概率,作为反馈信息;第四步,以全局任务完成概率作为反馈,完成增强学习模型在功能级干扰对抗决策上的训练和部署。本发明解决了现有技术中存在的红蓝方推演全流程任务时序决策效率低、泛化性差等问题。
声明:
“基于在线增强学习模型的全流程任务时序智能决策方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)