本发明公开了一种基于深度强化学习的分布式阻塞流水车间调度方法及系统,属于分布式阻塞流水线调度领域,该方法将一个车间视为一个智能体,每个智能体包括四个深度强化学习网络:Actor、Critic、targetActor和targetCritic,通过对智能体的训练获得Actor的最优网络参数,使得Actor能够对智能体是否接收待调度新工件做出使得所有智能体内所有工件总完成时间偏差最小的最优决策;从而在线决策时,只需对Actor输入智能体的当前观测值,即可输出使得所有智能体内所有工件总完成时间偏差最小的最优决策动作。本发明为基于数据驱动的科学决策,决策效率高,适用于各种加工场景,兼容性强。
声明:
“基于深度强化学习的分布式阻塞流水车间调度方法及系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)