本发明属于自动驾驶技术领域,具体为基于深度强化学习的自动驾驶车辆交叉口无冲突合作方法,包括步骤1:交叉口问题马尔可夫建模,综合考虑安全约束马尔可夫决策(constrained Markov decision process,CMDP)与马尔可夫博弈(Markov Game,MG)理论,将道路交叉口环境转化为为符合强化学习算法要求的模型;步骤2:单策略网络与双价值网络更新过程设计,设计单策略‑双评论家(Actor‑Critic1‑Critic2)网络架构;步骤3:马尔可夫形式数据搜集;步骤4:强化学习训练,训练单策略‑双评论家(Actor‑Critic1‑Critic2)神经网络;步骤5:强化学习测试,在仿真器Carla中实际测试该强化学习算法的性能,能够针对时变的交通网络拓扑结构输出符合预期的车辆通行策略,在安全、舒适与效率方面均能够获得良好性能。
声明:
“基于深度强化学习的自动驾驶车辆交叉口无冲突合作方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)