本发明提供了基于邻居感知的多智能体强化学习的交通信号控制方法,包括:将自适应交通信号控制问题建模为邻居感知的马尔可夫博弈,根据道路网络将交叉口建模为连通的智能体;所述邻居感知的马尔可夫博弈中,智能体的观测被定义为交叉口和它的邻居信息;所有交叉口在时刻采取动作后所观察到的智能体的奖励定义为所有进入的队列中等待车辆的平均数量;运行交通控制交互环境;确定智能体与其连接邻居之间的相关性;根据智能体之间的相关性对各个分散的加强学习智能体的观测和奖励信息进行加权,得到更新后的观测和奖励信息;根据更新后的观测和奖励信息训练智能体,进而每个智能体进行交通信号分散控制。本发明能够达到缓解交通拥堵的技术效果。
声明:
“基于邻居感知的多智能体强化学习的交通信号控制方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)