本发明公开了一种实时监测的强化学习可变时长信号灯控制方法,包括:通过事先安装于道路上的物联网设备采集道路上的实时交通数据生成新定义的压力信息;基于上述各个压力信息设计强化学习方法,生成强化学习状态;在每个路口配置一个强化学习智能体,并且设计一个监视属性,通过所述智能体实时判断当前相位下,路口监视属性是否到达阈值;并根据是否达到阈值确定是否对信号灯的相位进行调整;存储数据并通过强化学习智能体的回放机制来更新网络参数;各个路口配置的强化学习智能体通过当前道路情况控制交通信号灯的相位选择。本发明能够提高强化学习代理的学习能力,快速获得优秀的信号灯控制策略,并且控制效果大大提升。
声明:
“实时监测的强化学习可变时长信号灯控制方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)