本发明公开了一种基于纳什Q学习算法的交叉口联合信号控制方法,属于交通信号自适应控制技术领域,包括以下步骤:构建相邻交叉口协调控制模型并确立强化学习的状态、动作、奖励信息;构建纳什Q学习网络控制模型;获取模型训练和测试数据;训练纳什Q学习网络模型;对控制区域交叉口实施联合协同控制。本发明在基于强化学习思想实现交叉口自学习控制的基础上,考虑交叉口间存在的联系对交叉口整体区域控制效果的,在交叉口的协同博弈中实现交叉口间的纳什均衡控制。本发明通过博弈控制理论,实现相邻交叉口间的协调控制,在一定程度上缓解了因相邻交叉口缺乏合作机制而造成的拥堵问题。
声明:
“基于纳什Q学习算法的交叉口联合信号控制方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)