本发明涉及一种基于强化学习的异常用电判决系统及方法,该判决系统为用于异常用电判决的DRQN(Deep Recurrent Q Network,深度循环Q网络模型)模型,Q网络模型以当前的状态和当前选择的动作作为输入和输出,以状态作为判决指标确定当前回合的奖惩值;在Q网络模型训练达到设定次数时,将target Q网络模型的网络参数同步为Q网络模型的网络参数;将待测的用电概率序列输入到训练好的DRQN模型中,以状态作为待测的用电概率序列的动态阈值,根据动态阈值判断用电是否异常,以当前的状态作为判决指标确定奖惩值,并将该当前的状态作为动态阈值,因此该系统能够根据实时的用户的电力数据来更新阈值,从而能够有效提升跨用户场景的泛化能力。
声明:
“基于强化学习的异常用电判决系统及方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)