本发明公开了一种基于深度强化学习的多无人机任务规划方法。首先,根据任务需求,建立多无人机多目标场景下的分布式部分马尔科夫决策过程模型;然后,在建立的任务模型基础上,设计基于QMIX的任务规划算法。本发明设计了多智能体强化学习算法与协作任务奖赏函数,使得多无人机在集中训练后,执行任务时可以在分布式框架下根据不同的环境状态与自身观测做出协作完成任务的动作,使任务完成时间减少,最大化任务收益。
声明:
“基于深度强化学习的多无人机任务规划方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)