本发明属于多智能体系统的强化学习领域,具体涉及了一种基于动态图神经网络的多智能体对抗方法及系统,旨在解决现有基于图神经网络的多智能体模型训练速度慢、效率低以及图构建中需要较多人工干预的问题。本发明包括:获取每一个智能体的观测向量,并进行线性变换获得观测特征向量;计算相邻智能体之间的连接关系,构建智能体之间的图结构;结合观测特征向量对智能体之间的图结构进行嵌入表示;将嵌入表示用于动作网络的动作预测结果和评价网络的评价,进行网络时空并行训练;通过训练好的网络进行多智能体对抗中的动作预测和动作评价。本发明通过剪枝建立更真实的图关系,利用全连接神经网络加位置编码的实现时空并行训练,训练效率高、效果好。
声明:
“基于动态图神经网络的多智能体对抗方法及系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)