本发明公开了一种基于PPO和图卷积神经网络区域交叉口信号控制方法,包括以下步骤:构建交叉口协调控制区域并确立强化学习的状态、动作、奖励信息和图卷积神经网络的特征矩阵;构建区域交叉口分层信号控制模型;构建回放经验池,处理和提取训练数据和测试数据;训练区域交叉口分层信号控制模型;对区域交叉口进行统筹联合控制。本发明对控制区域建立多层信号控制模型,下层模型基于PPO算法构建多智能体控制模型;上层模型基于图卷积神经网络对各个交叉口进行统筹协调控制。本发明通过构建两层控制结构,既减少了单点控制模型的运算负担,又实现了对控制区域的总体最优控制,提高了控制区域内的车辆运行效率。
声明:
“基于PPO和图卷积神经网络区域交叉口信号控制方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)