本发明提供了一种基于深度强化学习的连续交叉口信号协同控制方法,该方法采用上下层Agent网络的DQN策略处理连续交叉口信号配时,以减少状态获取及反馈评价的复杂度,解决连续交叉口信号优化问题。为保证训练目标的平稳性,避免其训练陷入目标值与预测值的反馈循环中震荡发散,采用Dueling Double优化方法对DQN优化训练,相比于传统DQN控制模型,该方法可根据不同道路环境和交通状态实时切换交叉口相位,增加了交叉口之间的协作能力,保障交叉口行车畅通,提高交叉口通行能力,为缓解交通拥堵、提高出行效率并减少安全事故提出了新的解决方案和理论依据。
声明:
“基于深度强化学习的连续交叉口信号协同控制方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)