本发明公开了一种基于强化学习与动态配时的交通信号灯控制系统及方法,首先对十字路口进行建模,分别定义强化学习三要素state,reward,action;然后依据强化学习A2C算法构建策略网络和评估网络;最后收集路口实时信息,转化为state向量后输入到构建的策略网络和评估网络,输出action概率分布,系统根据action概率分布选择最合适的相位;决定相位后,接下来的一段时间就属于该相位的绿灯时间;由自适应定时控制器构成的动态配时模块根据实时的交通流信息,以最大化绿灯时间利用为目标,动态控制绿灯时间;当检测到绿灯时间的损失,就终止当前相位。本发明克服了固定分配交通灯时长而导致绿灯利用率不高的缺陷,减少了车辆的平均等待时间和二氧化碳等有害气体的排放。
声明:
“基于强化学习与动态配时的交通信号灯控制系统及方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)