本发明公开了一种联合LSTM和深度强化学习的家庭能源管理方法及介质,属于智能电网需求响应领域,方法包括:利用LSTM网络预测下一时间段的
光伏发电量信息和电价信息,并作为下一时间段马尔可夫决策过程的状态空间信息;根据家庭住宅中各类电气负荷对应电气设备的工作参数以及状态空间信息,将实时需求响应调度问题转化为状态转移概率未知的马尔可夫决策过程,得到MDP模型;设计基于深度神经网络的随机策略,以获得价值网络和策略网络;基于MDP模型,利用近端策略优化算法对价值网络和策略网络进行训练,并利用训练后的策略网络输出最优动作策略,根据最优动作策略管理各电气设备。实现最小化家庭用能成本和保证用户舒适度的目标。
声明:
“联合LSTM和深度强化学习的家庭能源管理方法及介质” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)