本发明涉及一种基于强化学习的火电燃烧优化方法,包括以下步骤:1)获取火力发电燃烧过程中的相关变量,定义M
t={i
t,s
t,p
t}为t时刻的数据信息;2)构建预测网络,根据最近两次历史数据信息M
t‑1、M
t以及下一时刻的可控输入i
t+1预测下一时刻的中间状态量s
t+1和性能指标p
t+1;3)定义S
t={M
t‑2,M
t‑1,i
t}为马尔科夫决策问题在t时刻的状态,以输入对应的增量矢量作为马尔科夫决策问题的动作A
t,并且以前后状态的线性加权综合指标KPI的增量ΔCI
t作为马尔科夫决策问题的奖励R
t,并定义状态跳转;4)采用深度决定性策略梯度对马尔科夫决策问题进行求解。与现有技术相比,本发明具有泛化能力强、普遍适用性、快速响应等优点。
声明:
“基于强化学习的火电燃烧优化方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)