本发明提供了一种使用平均场动作价值学习优化车间作业排程的方法,属于人工智能和运筹优化交叉领域。本专利使用多智能体马尔科夫决策过程建模车间作业排程的一次求解过程,在此过程中设备作为智能体根据本地观测选择作业进行加工,而且每个作业按生产的时长被动态划分为子作业。本方法使用模拟器处理对应现实条件的复杂约束,由多分类平均场强化学习算法进行多目标优化,从而对车间作业排程问题的痛点进行解耦,专注优化订单出货代价时能将生产周期整体时间压缩约30%,每个订单平均等待时间压缩约35%。
声明:
“使用平均场动作价值学习优化车间作业排程的方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)