本发明公开了一种基于多智能体强化学习和双层策略分配的多区域热电协调控制方法,包括:建立多区域热电联合系统数字孪生模型;创建多个区域智能体,并建立多个区域智能体间的通信机制;设计基于多智能体均衡学习算法的多区域均衡控制器,包括奖励函数、均衡选择函数和资格迹的选取;通过多区域均衡控制器对各个区域进行状态估计、更新资格迹、奖励值观测和更新状态‑动作值函数操作后,再进行多个区域部分信息的交互,在线寻求各区域最优均衡总控制策略;将区域热电联合系统中每台机组作为一个机组智能体,以各机组的爬升时间作为一致性变量,采用一致性算法将各区域总控制策略分配给各个机组,实现区域内各机组之间的协调控制。
声明:
“多智能体强化学习和双层策略分配的多区域热电协调控制方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)