本发明属于无人驾驶技术领域,公开了一种速差滑移转向车辆的目标跟随及动态障碍物避障控制方法,利用强化学习中的深度确定性策略建立四个神经网络;构建障碍物的代价范围从而确定动作的单步奖励函数;通过actor‑critic策略确定连续动作输出,并利用梯度传递不断更新网络参数;训练出根据当前状态进行跟随和避障的网络模型。本发明提升了车辆跟随及避障的智能性,能够更好的适应未知环境并很好的应对其他突发情况。减小了强化学习训练过程中建立仿真环境的复杂度。利用提前训练好的神经网络预测模型,由目标和障碍物的初始位置姿态及每步动作值能得到目标车辆和障碍物的每一步的位置姿态,提高了仿真的准确率和效率。
声明:
“速差滑移转向车辆的目标跟随及动态障碍物避障控制方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)