本发明公开了一种基于时空数据强化学习的自动驾驶速度控制框架,主要解决自动驾驶汽车难以及时对较远车辆的急剧变速行为做出反应的延时性问题。该控制框架包括离线训练:利用现实生活中的车辆驾驶数据对自动驾驶车辆的速度决策进行学习;在线模拟:使用已经训练好的网络来检测自动驾驶车辆在特定场景下的表现。采用本发明的速度控制框架的自动驾驶车辆能够在复杂的交通环境中有良好的表现,本发明综合考虑了交通安全性,驾驶员舒适度和交通效率,使用了长短期记忆神经网络(LSTM),能够让自动驾驶汽车在进行速度决策时不只是考虑当前时刻的环境数据,可以同时考虑多个历史时刻的环境数据,让自动驾驶车辆能够在遇到突然的变速行为有更好的表现。
声明:
“基于时空数据强化学习的自动驾驶速度控制框架” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)