本发明公开了一种基于强化学习的数据中心能效优化方法和系统,属于云计算技术领域。本发明的一种基于强化学习的数据中心能效优化方法和系统,所述数据中心能效优化系统由数据集成管控系统、IDC动环监控系统和DRL中心模型系统组成。为解决现有数据中心能耗优化方法中存在的能效优化低、成本高的问题,采用一种离线强化学习的方式,通过设计初始的控制策略,记录系统在运行初始策略下的数据,其中包括状态,行动,奖励,并使用标准强化学习/函数模拟组合来学习一个价值函数,用以估算某个状态下采取特定行动对应的累计期望奖励,来获得预测的PUE值。
声明:
“基于强化学习的数据中心能效优化方法和系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)