本申请涉及一种基于深度强化学习的资源动态调度方法。所述方法包括:根据动态调度标准输入的数据结构对动态任务调度需求进行预处理,得到动态调度的标准输入数据;通过动态任务调度中预先设置的基本原则构建影响域评价函数,将影响域评价函数作为动态调度智能体模型与环境交互的奖励函数;利用奖励函数和动态调度的标准输入数据以及深度Q学习框架对动态调度智能体模型进行强化学习离线训练,得到训练好的动态调度智能体模型;根据训练好的动态调度智能体模型对测试集中新到达的动态任务进行在线快速资源调度,得到新调度方案包。采用本方法能够提高资源动态调度效率。
声明:
“基于深度强化学习的资源动态调度方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)