本申请的目的是提供一种基于强化学习和规则融合确定驾驶策略的方法或设备;基于车辆的驾驶参数信息,通过强化学习算法确定所述车辆的第一驾驶策略信息;基于所述驾驶参数信息及所述车辆的驾驶规则信息,对所述第一驾驶策略信息进行合理性检测;基于所述合理性检测的检测结果,确定所述车辆的目标驾驶策略信息。与现有技术相比,本申请对通过强化学习算法计算确定的第一驾驶策略信息用规则进行约束,使得本申请的驾驶策略的确定方法与现有的采用规则算法实现车辆控制的方法、或采用强化学习算法实现车辆控制的方法相比更加智能,并且提高了最终确定的驾驶策略的合理性和稳定性。
声明:
“基于强化学习和规则确定驾驶策略的方法与设备” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)