本发明属于无人集群协同技术领域,具体涉及一种基于多智能体分层强化学习的弱观测条件下无人集群协同方法。本发明首先对环境进行状态定义,然后按照POMDP模型对状态空间进行定义,包括观察集合以及观察函数,再随机初始化一个由一系列概率值分布的信念状态,同时根据传统强化学习思想,设置状态转移函数、立即回报函数、折扣率、探索率等;然后采用基于MAXQ算法的分层强化学习框架,将无人集群的任务分层,达到对复杂的任务进行分而治之的目的,降低集群的参数维度,有效缓解计算机存储不足和计算繁琐的压力,提高强化学习效率和精度。本发明能够保证多个智能体参与协同任务时保持更高的效率和更好的协同效果。
声明:
“基于多智能体分层强化学习的弱观测条件下无人集群协同方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)