一种基于强化学习的超启发算法的车辆路径优化方法,包括以下步骤:步骤1车辆路径问题分析;步骤2初始化;步骤3经验池、序列池存储;步骤4解的接受保留;步骤5判断经验池容量,容量足够则进入步骤8学习,未满,则进入步骤6;步骤6选择Action;步骤7保留最优解;步骤8选择学习样本,并初始化神经网络;步骤9神经网络学习更新;步骤10更新目标值网络;步骤11判断学习结束情况,学习未结束,则进入步骤8继续学习更新;反之,则进入步骤6选择Action,返回主循环;步骤12程序结束,输出车辆路径距离最优值及最优值路径序列。本发明提供了一种高层选择策略为强化学习的超启发算法的车辆路径优化方法。
声明:
“基于强化学习的超启发算法的车辆路径优化方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)