本申请公开了一种基于强化学习的无人车避障方法及装置,利用强化学习算法,在预先获取的环境约束下,对动态窗口避障模型进行训练,得到预测窗口。基于预测窗口和速度采样约束,采样多组速度,并针对每组采样速度,生成一组轨迹。利用预先构建的避障惩罚函数和评价函数,对多组轨迹进行评分。从各组轨迹中选取评分最高的轨迹,作为目标轨迹。将目标轨迹所对应的采样速度,输出至无人车的控制系统中,使得无人车依据目标轨迹所对应的采样速度进行驱动。利用强化学习对动态窗口避障模型进行训练,并利用避障惩罚函数从各组轨迹中选出避障性能较高的轨迹。可见,利用本申请所述的方法,能够提高无人车的避障性能,实现无人车的主动避障。
声明:
“基于强化学习的无人车避障方法及装置” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)