一种基于具有动作自寻优能力的深度强化学习的智能发电控制方法,包括步骤1、确定状态集S;步骤2、确定动作集A
k;步骤3、采集各个区域电网的实时运行数据:频率偏差Δf和功率偏差ΔP,计算各个区域控制误差ACE
i(k)的瞬时值与控制性能标CPS
i(k)的瞬时值;步骤4、确定当前状态S与当前内部状态h,再根据当前状态S、内部状态h以及奖励函数,获取某区域电网i的一个短期奖励函数信号R
i(k);步骤5、通过计算获取目标Q值函数y
k与损失函数L
k;步骤6、通过计算更新权值θ
k和
步骤7、搜索并评估新动作,更新动作集A
k+1;步骤8、对所有区域电网执行相应操作;步骤9、返回步骤3。本发明可有效获取电网最优协调控制,可从自动发电控制角度,解决大规模新能源以及分布式能源接入,为互联电网所带来的强随机扰动问题。
声明:
“基于具有动作自寻优能力的深度强化学习的智能发电控制方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)