本发明公开了一种基于强化学习的无人驾驶汽车多车道行驶的决策方法,首先建立强化学习训练模型,利用强化学习算法收益函数对神经网络参数进行更新、修正从而建立基于强化学习‑BP神经网络算法的决策系统。无人驾驶汽车在多车道行驶过程中,传感器采集周围车辆信息,上述决策系统给出执行动作并预测车辆行驶状态,由收益函数判断车辆行驶危险度,决策多车道工况下车辆当前时刻的最优驾驶行为。本发明能提升无人驾驶汽车多车道高速行驶的效率与安全性,实现在高不确定性、动态环境下的无人驾驶汽车高效、安全的驾驶决策。
声明:
“基于强化学习的无人驾驶汽车多车道行驶的决策方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)