本发明公开了基于日内多目标强化学习的梯级电站离线调度方法及系统,涉及电力系统调度技术领域,其技术方案要点是:根据日内调度场景对调度任务进行划分,得到战略任务以及兼顾任务;利用贝叶斯回归模型从日内调度的决策因子中预测未来来水和电力需求的概率分布;根据战略任务、兼顾任务和决策因子构建梯级电站调度的调度仿真系统;根据日内调度场景确定多目标的标准化回报函数,并将标准化回报函数加入调度仿真系统以实现对调度策略进行评价;根据调度策略的评价结果在调度仿真系统中训练调度策略,得到离线的调度优化模型;进行效果验证。本发明使得梯级电站的调度策略生成过程准确度较高,整体实现的可靠性较强。
声明:
“基于日内多目标强化学习的梯级电站离线调度方法及系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)