本发明公开了一种工业过程的优化学习控制性能提升方法。本发明在传统状态空间模型的基础上,通过构建包含跟踪误差和状态增量的新型状态空间模型,在执行器新模型的基础上提出性能指标并构建值函数与Q函数,最后通过设计非策略Q‑学习算法进行最优控制律学习及性能指标的优化,得到最优的控制器增益,进而提升控制性能。本发明不依赖于系统的数学模型而是对大量在线数据的强化学习,这在实际系统状态很难直接测量或者只能测量部分状态信息的环境下有着突出优势,可以有效地改善实际过程生产的控制性能,使得控制效果与控制精度得到提升。
声明:
“工业过程的优化学习控制性能提升方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)