一种基于强化学习的电力设备检修决策生成方法涉及电力设备检修技术领域,解决了现有基于强化学习的建模策略的方式需要大量的数据且数据利用率不高的问题,包括:计算第一割集并据此计算电力设备引起电网停电损失的第一权重;将电力设备检修决策生成问题建模为一个马尔可夫决策过程,定义电力设备的运行状态;应用强化学习方法求解马尔可夫决策过程得到最优策略和最优策略的价值矩阵,第一权重加权到强化学习的电网的整体运行损失中,强化学习以最小化电网的整体运行损失为目标;计算第二割集并据此计算第二权重,加权到电网的整体运行损失中,改进最优策略。本发明够间接实现多个电力设备之间的通信,数据利用率高,在专业领域上的应用门槛较低。
声明:
“基于强化学习的电力设备检修决策生成方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)