用于在多主体强化学习中利用递归推理图的系统和方法,所述系统和方法包括:接收与在多主体环境内行进的自我主体和目标主体相关联的数据;以及利用多主体中心参与者评论者框架分析与所述自我主体和所述目标主体相关联的所述数据。所述系统和方法还包括:基于所述多主体参与者评论者框架执行k级递归推理以计算所述自我主体和所述目标主体的更高级别递归动作。所述系统和方法还包括基于以下至少一者控制所述自我主体和所述目标主体中的至少一者在所述多主体环境内操作:与所述自我主体相关联的主体动作策略和与所述目标主体相关联的主体动作策略。
声明:
“用于在多主体强化学习中利用递归推理图的系统和方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)