本发明公开了一种基于视觉的深度模仿强化学习驾驶策略训练方法,包括:构建模仿学习网络;训练所述模仿学习网络;对训练完成的模仿学习网络进行网络拆分,获得感知模块;构建DDPG网络,获得控制模块;通过所述感知模块和所述控制模块,完成深度模仿强化学习模型的搭建;训练所述深度模仿强化学习模型。所述模仿学习网络包括5个卷积层和四个全连接层,其中卷积层用于提取特征,全连接层用于转向角、油门和刹车开度的预测;此外,深度模仿强化学习模型训练过程设置了奖励函数,保证弯道行驶的舒适性和安全性。
声明:
“基于视觉的深度模仿强化学习驾驶策略训练方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)