本发明提供了基于分层强化学习的自动驾驶决策方法和装置,包括:获取上游数据,上游数据包括感知融合数据、定位数据和控制数据;将上游数据输入到深度学习的模型中,输出得到感受野模型和第一预测轨迹;将感受野模型和第一预测轨迹输入到强化学习算法中,输出得到第一规划轨迹;根据第一规划轨迹控制车辆执行相应操作;将深度学习的模型和强化学习算法结合,确保了决策的稳定性和前瞻性,降低了预测的计算消耗。
声明:
“基于分层强化学习的自动驾驶决策方法和装置” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)