本公开提供了“使用深度强化学习的自动导航”。公开了一种用于训练自主车辆到达目标位置的方法。所述方法包括检测模拟环境中的自主车辆的状态,以及使用神经网络将所述车辆从初始位置导航到目标目的地。在所述训练阶段期间,对于所述自主车辆采取的期望动作,第二神经网络可以对第一神经网络进行奖励,并且对于所述自主车辆采取的不期望的动作,可以对所述第一神经网络进行惩罚。本文还公开并要求保护对应的系统和计算机程序产品。
声明:
“使用深度强化学习的自动导航” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)