本发明公开了一种基于双层强化学习电网‑用户相协同的电压无功优化方法。为了有效协调配电网的电网侧设备和用户侧设备这两类所属权不同的资源,本发明从非对称马尔科夫博弈的角度提出了一种双层无功电压优化框架。其中,电网侧的配电运行商(DSO)被视为在上层做决策的领导者,目的是最小化系统的网损;用户被视为在下层做决策的跟随者,目的是缓解节点的电压偏差。除此之外,本发明还提出了一种无模型的Bi‑level Actor‑Critic(Bi‑AC)算法来解决上述非对称马尔科夫博弈模型,该算法为领导者和跟随者智能体制定了独特的策略(actor)和价值(critic)网络,同时还定义了领导者智能体的决策优先级。最后,本发明通过一个标准的IEEE33节点测试系统和实际电网运行数据验证了所提方案的有效性。
声明:
“基于双层强化学习电网-用户相协同的电压无功优化方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)