本发明公开了融合深度强化学习和遗传算法的短程支线航班调度方法,DRL模块利用编码器提取数据在高维空间的特征表达,解码器则根据规则和概率选择路径,最后使用强化学习的训练方法更新参数;训练并迭代了足够多次网络参数后,测试数据能通过网络计算得到一系列强大的“初始解”将“初始解”所组成的“种群”将作为输入传入遗传算法得到最终解。本发明有益效果:本发明深度强化学习完成了从问题输入到问题输出的端到端的求解方案,具有良好的泛化性;局部搜索容易陷入局部最优陷阱,依靠DRL提供的好的初始种群可以辅助搜索过程跳出“局优”;对于一定规模的问题,神经网络只需一次预训练,求解时响应速度快,提高搜索效率,减少搜索空间和时间。
声明:
“融合深度强化学习和遗传算法的短程支线航班调度方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)