本发明公开一种基于多智能体强化学习的无人机集群高效通信方法,构建无人机飞行环境模拟器;随机选取一架无人机作为队长并标记;每架无人机获取并维护本机的局部观测值,将自身观测值进行编码并发送给队长;队长根据每架无人机的自身观测值,分别对全局观测值进行attention注意力机制处理,根据信息的重要程度来决定信息的权重,继而将计算好的观测值发送给每个队友,作为队友的全局观测值;训练阶段以全局观测值作为训练数据,直到策略网络收敛;执行阶段以分布式的方式进行;对队长的存活给一个额外的奖励。本发明可以在通信开销较小的条件下解决无人机集群集中式信息交互的问题,给予无人机自主决策权。
声明:
“基于多智能体强化学习的无人机集群高效通信方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)