一种基于强化学习的多时间尺度系统最优跟踪控制方法,涉及一种工业过程设计控制方法,本发明应用奇异摄动理论和强化学习技术在有限时域内解决具有耦合子系统的多时间尺度大系统的最优跟踪控制问题;本发明一个突出贡献是开发一种基于数据驱动的强化学习方法,用于多时间尺度未知大系统最优跟踪控制;为此,首先利用奇异摄动理论将多时间尺度跟踪问题分解为慢子系统的线性二次型跟踪问题和快子系统的动态博弈问题;然后,在此基础上,提出了一种仅利用系统实时测量数据分布式非策略积分强化学习算法来寻找分布式复合反馈控制器;因此,运行指标可通过一种近似最优的方法来跟踪其规定的目标值,实现多时间尺度系统以最优的方式达到跟踪控制效果。
声明:
“基于强化学习的多时间尺度系统最优跟踪控制方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)