本发明公开了一种基于强化学习的多设备自适应监测方法,包括以下步骤:构建基于图的无人机环境巡逻监控的环境模型拓扑结构;对无人机的运动方式和通信范围进行定义和约束;构建基于信息交互的巡逻监控协同模型;利用Q‑Learning方法获取最优的多无人机巡逻监控策略;构建分布式巡逻监控协同模型;通过集中式训练分布式执行的训练方法优化改进的值函数分解网络VDNs模型,利用优化后的模型实现极端环境多无人机自适应巡逻监控。本发明算法的鲁棒性很强,能够有效地解决不同复杂度的环境拓扑监控问题;在同一场景中,能够适应增加或者减少无人机数量的极端情况;且解决了极端环境下,多无人机之间不能互相通信的问题。
声明:
“基于强化学习的多设备自适应监测方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)