本发明公开了一种网联车探测状态感知的交叉口强化学习信号控制方法,在网联自动驾驶车辆具有一定市场渗透率的情况下,将交叉口进口道划分为一定数目的网格,以网联自动驾驶车辆作为移动传感器,探测周围车辆的实时位置、速度等数据,将数据填充到相应的进口道网格中,形成网格填充矩阵。将信号灯视作智能体并设计马尔可夫决策过程,以网格填充矩阵作为智能体状态,以相位切换为动作,以车辆更新等待时间为奖励函数。采用深度策略梯度算法训练智能体,可以减少车辆的等待时间,同时实现排队长度以及平均速度的优化。本发明提出的方法能够在对信号交通口进行控制时减少交通拥堵,缓解因交通拥堵带来的交通延误和碳排放及能源消耗。
声明:
“网联车探测状态感知的交叉口强化学习信号控制方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)