本发明涉及计算机技术领域,特别涉及一种基于深度强化学习的数据中心资源离线调度方法。深度强化学习可以为资源调度管理的人为启发式方法提供一个可行的替代方案。通过不断学习,深度强化学习方法可以针对特定工作负载(例如周期性负载或随机负载)进行优化,并在各种条件下保持高质量优化调度结果。把最小化平均作业slowdown(系统减缓时间)作为优化目标,通过计算离线调度中每一次调度的奖励值,引导深度网络向着目标优化,最终向着最优目标训练。结果显示,在本发明的大量实施例测试中,使用深度强化学习的离线调度方法的slowndown远低于SJF(最短作业优先算法)等传统的优化作业调度方法,体现出深度强化学习方法在这一领域的优势。
声明:
“基于深度强化学习的数据中心资源离线调度方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)