本发明提供了一种自动驾驶决策方法,包括:获取车辆周围的环境感知信息;根据环境感知信息和预设的地图文件,进行决策,生成多个决策节点;通过第一模型计算每个决策节点的输出,生成第一决策结果;通过第二模型计算每个决策节点的输出,生成第二决策结果;根据环境预测信息,分别计算第一决策结果的第一收益和第二决策结果的第二收益;比较第一收益和第二收益,并将收益值高的对应的决策结果作为目标决策结果。由此,避免产生“维度爆炸”现象,并且可以直观反映各个阶段的决策结果,充分结合了规则方法和强化学习方法各自的优势,在某个场景的决策结果不一致时能够快速定位问题,实现两个模型的相互促进和共同提升。
声明:
“自动驾驶决策方法及装置” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)