本公开提供了一种强化学习模型的训练方法、能耗确定方法和装置,涉及人工智能领域,具体为强化学习、深度学习、物联网等技术领域,适用于能耗预测场景。强化学习模型的训练方法包括:将历史能耗数据和多个目标模型的模型能力数据,输入待训练的强化学习模型的第一子模型,输出与多个目标模型相关联的权重;利用待训练的强化学习模型的第二子模型,基于权重确定用于评价第一子模型的评价值;基于评价值,调整第一子模型的模型参数和第二子模型的模型参数,得到经训练的强化学习模型。
声明:
“强化学习模型的训练方法、能耗确定方法和装置” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)