本发明提出一种基于深度强化学习的容器云集群资源利用优化方法,包括:对原始负载数据进行预处理并组装为输入状态s;构建深度Q网络模型,将输入状态s输入深度Q网络模型中,深度Q网络模型以一定概率随机选取动作a,或选取使深度Q网络模型最优的动作a,执行一次超卖比预测;通过奖励函数对所选取的动作a进行评估,得到奖励r并进入下一状态s′;将输入状态s、动作a、奖励r、下一状态s′组成四元组并作为训练样本放入缓存中;当达到预设的训练间隔时,从缓存中采样e个训练样本并输入深度Q网络模型中进行训练,更新深度Q网络模型的参数;当深度Q网络模型经过E轮训练后,将完成参数更新的深度Q网络模型应用于确定超卖策略。
声明:
“基于深度强化学习的容器云集群资源利用优化方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)