本发明涉及一种面向自动驾驶的基于深度强化学习的端到端导航避障方法,采用激光雷达,对激光雷达点云进行采样,生成环境一维激光点云,并通过代价地图转换算法进行转换,得到表示环境动态静态障碍物的障碍物地图;通过与仿真环境进行闭环交互,收集环境障碍物地图,从而生成导航环境数据集;构建异构智能体自我博弈避障模型,异构多智能体自我博弈模型包括:观测空间、动作空间、奖励函数和神经网络;进行多阶段并行课程学习,以使神经网络更快更好的达到局部最优解,同时加速学习过程,最终得到训练后的异构智能体自我博弈避障模型;将训练好的异构智能体自我博弈避障模型部署到实际车辆上,在现实世界中实现导航和避障。
声明:
“面向自动驾驶的基于深度强化学习的端到端导航避障方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)