本发明公开一种基于近端策略优化的用户实时自治能量管理优化方法,管理优化方法包括S1:对用户DER设备进行分类和建模;S2:基于S1中对用户DER设备的分类及建模,将用户实时自治能量管理优化问题建模为序贯决策问题;S3:利用长短期记忆神经网络提取实时的时序数据的未来走势,辅助步骤S4和S5中深度强化学习进行策略优化;S4:将S3中提取的未来走势和能量管理智能体观测的内部状态特征输入到基于深度神经网络的策略函数,赋能能量管理智能同时学习离散与连续动作,实现对各设备的控制;S5:采用基于近端策略优化算法赋能在S4中的离散与连续动作中学习能量管理优化策略。本发明管理优化方法最小化用电成本的同时提升策略对不确定性的适应性。
声明:
“基于近端策略优化的用户实时自治能量管理优化方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)