本申请揭示了一种基于强化学习模型的信息控制方法、装置、计算机设备和存储介质,所述方法包括:获取当前时间与信号灯所处路口的图像;若所述当前时间与所述信号灯所处路口的图像符合使用条件,则从所述信号灯所处路口的图像中提取出指定状态特征;将所述指定状态特征输入所述信号灯动作预测模型中,从而得到预测动作;所述信号灯动作预测模型基于强化学习模型并通过具有指定数据结构的样本数据训练得到的,所述指定数据结构由多个数据块构成,具有同一信号灯相位和同一预测动作的样本数据被存在同一个所述数据块中;根据所述预测动作控制所述信号灯。从而使信号灯的控制更适用于更多的交通状况,更具鲁棒性。
声明:
“基于强化学习模型的信息控制方法、装置和计算机设备” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)