本发明公开了一种基于强化学习的城市道路自动泊车方法,包括:S1、车位线识别流程,S2、状态输入流程,以及S3、泊车决策控制流程,其中,泊车决策控制流程包括:S31、Actor使用经验池中计算好的状态价值与Critic网络预测当前状态价值进行神经网络的更新,用M均方差误差作为Loss函数,对神经网络进行训练,得到更新后的目标神经网络;S32、将状态输入向量输入停车动作策略π*对应的更新后的目标神经网络,输出得到车辆的转向角和加速度,控制车辆的移动。
声明:
“基于强化学习的城市道路自动泊车方法及系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)