本发明公开了一种基于深度强化学习的自动驾驶行为一体化决策方法,从两种基本驾驶行为,即换道和跟驰行为的优先级和逻辑出发,首先采用上下两层深度强化学习模型处理大规模混合状态空间并保证换道决策和跟驰决策的复合动作输出,在上层模型中使用D3QN算法来区分环境的潜在价值和换道决策的价值,在下层模型采用DDPG算法处理跟驰决策从而输出连续的车速控制。选取混合标准驾驶工况对两种算法进行耦合训练之后,在利用NGSIM数据重建的高度复杂的驾驶场景中对模型进行测试。本发明提出的集成驾驶决策模型提高了跟驰与换道决策的协同性,并将车道优势函数与危险动作屏蔽机制整合到决策模型中,显著提升了行驶速度,优于其他的智能驾驶决策模型。
声明:
“基于深度强化学习的自动驾驶行为一体化决策方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)