本发明涉及强化学习、传统控制和多智能体等领域,为提出一种面向围捕任务的基于多智能体确定性策略梯度和避障机制的多无人机智能协同决策方法,考虑状态部分可观测的特点、任务环境动态性与不确定性因素的影响,采用多智能体确定性策略梯度方法和避障机制,获得最优行动策略,达到多无人机智能协同决策的目的,本发明,面向围捕任务的多无人机智能协同决策方法,首先基于比例控制和避障机制建立初步决策方案,随后采用多智能体确定性策略梯度方法对初步决策方案进行评价改进,获得最优行动策略,最后,在线应用优化后的网络实时给出决策结果,完成面向围捕任务的多无人机任务决策。本发明主要应用于多无人机智能协同场合。
声明:
“面向围捕任务的多无人机智能协同决策方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)