本发明公开了一种基于注意力机制与强化学习的多智能体游戏AI设计方法,首先,对智能体原始观测信息进行基于实体的局部信息划分并分组;其次,基于每个分组信息表征得到当前时刻的局部策略,根据动作‑观测历史信息获得对应局部信息的注意力权重,根据注意力权重对所有局部策略进行聚合得到局部信息策略;最后,将局部信息策略与原始观测信息作为策略输入输出的基准策略进行聚合得到智能体最终的策略。与现有技术相比,本发明解决了多智能体系统中智能体观测信息冗余问题,能够有效的提高智能体的学习效率。
声明:
“基于注意力机制与强化学习的多智能体游戏AI设计方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)