本发明公开一种基于强化学习的线性系统数据驱动模型预测控制方法,能够保证控制算法的稳定性,避免模型预测控制中复杂的终端约束、终端集、终端代价设计等。包括:在开环状态下,对线性系统施加随机的输入,并测量线性系统的输出,收集N组输入‑输出轨迹,分别构建汉克尔矩阵;在采样时刻k,利用线性系统的历史轨迹求解所述汉克尔矩阵优化问题,预测得到线性系统未来的输入、输出和最小化目标函数;根据所述最小目标函数利用强化学习方法迭代更新权重直到终端代价函数收敛;将预测得到的最优控制输入中的第一个元素作为输入作用于系统,并观测系统输出,循环直到系统稳定。
声明:
“基于强化学习的线性系统数据驱动模型预测控制方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)