方法、系统和装置,包括编码在计算机存储介质上的计算机程序,用于预测在具有多个代理的环境中的代理的动作或对所述代理的影响,特别是用于强化学习。在一个方面,关系前向模型(RFM)系统接收表示多个代理中的每个代理的代理动作的代理数据,并实现:编码器图神经网络子系统,将代理数据处理为图数据以提供编码后的图数据;循环图神经网络子系统,处理编码后的图数据以提供处理后的图数据;解码器图神经网络子系统,解码处理后的图数据以提供解码后的图数据;以及输出,提供与一个或更多个代理的预测动作有关的、解码后的图数据的节点属性和/或边属性的表示数据。强化学习系统包括RFM系统。
声明:
“用于多代理环境中的行为预测和强化学习的图神经网络系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)