本发明涉及一种基于强化学习的交通弹性调控方法及系统。该方法包括:将交通网络划分为若干区域,并采集每个区域的车流信息;根据车流信息确定每个区域的宏观基本图;基于宏观基本图,确定各个区域供需平衡时的流量水平;根据流量水平确定交通网络的失衡率;根据失衡率,通过渗流分析确定交通网络的临界失衡阈值;建立多智能体强化学习模型,并根据车流信息、流量水平以及临界失衡阈值对多智能体强化学习模型进行学习训练,生成训练后的多智能体强化学习模型;利用训练后的多智能体强化学习模型调控实际交通网络,使得实际交通网络的当前失衡率小于所述临界失衡阈值。本发明能够在最短调控周期下达到最佳调控效果。
声明:
“基于强化学习的交通弹性调控方法及系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)