本发明涉及在预定地理区域中分配资源的方法,其包括:检索(S102)一组度量,该度量指示与至少两方的资源的操作相关的关注因素,每一方具有多个资源;检索(S104)指示每一方的优选度量值的优化政策;检索(S106)包括用于在预定区域中分配资源的策略的至少一个模型,该至少一个模型基于从用于分配资源的一组场景中学习;从实时系统中检索(S108)至少指示当前交通状况的环境数据;在考虑到至少一个模型和环境数据的情况下,在至少两方的优化政策中的度量之间建立(S110)纳什均衡;根据已建立的纳什均衡的结果在地理区域中分配(S112)资源。
声明:
“基于强化学习使用半合作纳什平衡来协调多方服务的方法和系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)