本发明公开了一种多智能体强化学习滚动调度方法、装置、设备及存储介质,所述方法通过构建高比例新能源电力系统对应日内有功的滚动调度模型;对滚动调度模型进行多智能体的去中心化部分可观马尔科尔夫决策过程建模,获得多智能体调度架构;获取多智能体调度架构的改进区域特征聚合图的注意力网络,并获取支持时空多维特征聚合的多智能体强化学习算法,根据注意力网络和多智能体强化学习算法构建基于多智能体强化学习的分布式日内滚动调度算法的训练架构,建模求解速度快,训练过程简单,符合电网调度实际应用场景,提高了多智能体强化学习滚动调度的准确性,提升了多智能体强化学习滚动调度的速度和效率。
声明:
“多智能体强化学习滚动调度方法、装置、设备及存储介质” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)