本发明公开了一种基于注意力模型和深度强化学习的无人车行驶决策方法通过构建感知模块和决策模块完成无人车行驶决策任务,具体为:通过搭建自注意力模型和长短时记忆网络对感知模块进行建模,然后通过自动编码器模型对感知模块进行训练;利用卷积网络和全连接网络搭建决策模块,所述决策模块基于深度确定性策略算法。利用感知模块对观测数据进行降维,再利用深度强化学习决策模块进行策略学习,并通过引入优先经验回放的方法,提高数据样本的利用率,从而提高算法的训练速度。本发明方法通过在自动驾驶环境中进行模型训练后,可以在复杂的道路环境中安全行驶,并根据环境的变化制定合理的驾驶策略。
声明:
“基于注意力模型和深度强化学习的无人车行驶决策方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)