零交互通信的飞行器集群协同搜索方法,利用目标阵型分布的信息,统计目标位置分布的数据,形成先验信息;初始化搜索经验池和搜索策略,并建立搜索任务交互环境;构建基于多智能体强化学习的飞行器集群协同搜索框架,智能体从环境中获得观测信息;为每个智能体构建内在奖励Q网络、外在奖励Q网络,为飞行器集群构建混合Q网络,进行学习训练;执行时,智能体依据局部的观察进行动作选择,满足大部分实际环境的现实约束。本发明解决了现有技术中存在的搜索空间大场景内奖励稀疏智能体难以获得奖励信号学习缓慢、搜索过程依赖通信和全局信息等问题。
声明:
“零交互通信的飞行器集群协同搜索方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)