本发明公开了基于深度强化学习的车道保持方法,包括采集环境‑智能体状态观测值,即环境状态数据和车辆状态数据并进行数据的预处理后用以传入网络模型和初始化网络。网络基于交互数据以强化学习的方式学习车道保持这一驾驶任务,期间不断更新网络直至模型收敛,然后基于收敛后的网络进行任务执行的最优策略输出控制。本发明提供的基于深度强化学习的车道保持方法,实现了小车车道保持任务的自学习,简化了传统的车道检测‑处理‑控制流程,实现了端到端的命令输出控制。
声明:
“基于深度强化学习的车道保持方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)