本申请公开了一种基于强化学习的交通信号灯控制方法与系统,包括:S1,控制器根据局部观测信息和上层策略,从多个子策略中选择一个;S2,子策略根据局部观测信息,从多个相位中选择一个执行一个时间步;S3,控制器根据获取到的奖励和当前时间观测信息,更新子策略的参数;S4,更新后的子策略选择保持或更换相位,执行一个时间步;S5,控制器根据执行的时间步和周期的数量以及邻域观测信息,更新权重参数和上层策略,执行S1,或执行S3,或得到训练好的智能体;S6,使用训练好的智能体控制一个路口中的所有交通信号灯。能够在控制其自身对应的路口交通信号灯的同时,兼顾配合与其相邻的路口,进行协同合作,从而缩短全局车辆在路口的平均行驶时间。
声明:
“基于强化学习的交通信号灯控制方法与系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)