本发明提供一种按需派送车辆的路径规划方法及装置。该方法包括:获取待分析的订单数据;将所述订单数据输入到双阶段强化学习预测模型中,得到所述双阶段强化学习预测模型输出的车辆配送路径规划策略;其中,所述双阶段强化学习预测模型是基于预设的样本订单数据、所述样本订单数据对应的配送路径规划策略及其结果迭代训练得到;所述双阶段强化学习预测模型包括:用于进行操作算子选择的算子选择器以及用于进行操作算子作用路径选择的路径选择器。采用本发明按需派送车辆的路径规划方法,能够基于双阶段强化学习预测模型引入深度强化学习的方法指导启发式操作在策略空间中进行高效搜索,提高了按需派送车辆的路径规划的效率和准确度。
声明:
“按需派送车辆的路径规划方法及装置” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)