本公开提供了一种路径规划模型的训练方法和路径规划方法、装置、设备、介质,涉及人工智能领域,具体涉及深度学习和计算机视觉领域,可应用于自动驾驶和机械生产等场景。训练方法的具体实现方案包括:采用编码网络对第一样本数据中的第一环境数据进行编码,获得第一环境数据的第一特征数据,该第一样本数据还包括第一实际路径数据;将第一特征数据输入深度强化学习网络,得到针对第一环境数据的预测路径数据;基于第一实际路径数据和针对第一环境数据的预测路径数据,对编码网络和深度强化学习网络进行训练。其中,编码网络是采用第二样本数据预训练得到的,第二样本数据包括第一样本数据所属的目标领域的数据及除目标领域外其他领域的数据。
声明:
“路径规划模型的训练方法和路径规划方法、装置” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)