本发明提出了一种基于情景记忆的无人机控制决策方法,实现步骤为:构建无人机控制场景;获取各个无人机的观测信息;构建深度强化学习模型H并进行初始化;构建情节记忆探索表;对深度强化学习模型H迭代训练;使用训练后的深度强化学习模型H对无人机行为进行自主控制。本发明使用多智能体分布式情节记忆探索表存储智能体过去相似经历的最优回报,并在智能体实际的探索过程中采用随机动作和情节记忆探索表中最优探索动作组合的形式进行动作选取,提高无人机控制任务的完成率和深度强化学习算法的收敛时间。
声明:
“基于情景记忆的无人机控制决策方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)