提供了使用强化学习技术来导航自主车辆的系统和方法。在一个实施方式中,用于主车辆的导航系统可以包括至少一个处理设备,该至少一个处理设备被编程为:从相机接收表示主车辆的环境的多个图像;分析多个图像以识别与主车辆相关联的导航状态;向经训练的导航系统提供导航状态;从经训练的导航系统接收用于由主车辆响应于所识别的导航状态而执行的期望导航动作;关于一个或多个预定导航约束分析期望导航动作;确定主车辆的实际导航动作,其中实际导航动作包括基于一个或多个预定导航约束确定的对期望导航动作的至少一个修改;并且响应于所确定的主车辆的实际导航动作引起主车辆的导航致动器的至少一个调节。
声明:
“具有施加的约束的经训练的系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)