本发明提出一种基于强化学习的神经网络逆控制器进行控制的方法,神经网络控制包含神经网络逆控制器和神经网络模型两部分,神经网络模型主要用于对被控制对象进行辨识,并向神经网络逆控制器提供被控制对象信息。神经网络逆控制器采用强化学习中的行动者‑评论家结构,行动者采用神经网络根据评论家提供的值函数学习控制策略,依据策略函数给出下一步控制增量,评论家采用神经网络建立状态、行动与值函数的拟合关系,值函数根据预测控制中的性能评价函数设置,能有效解决控制系统的迟延问题。本发明的方法能够适应时滞系统的控制要求,能根据被控参数未来的趋势使执行机构提早动作,抑制被控量的波动,同时能适应被控对象时变和非线性的特性,提高控制品质和稳定性。
声明:
“基于强化学习的神经网络逆控制器进行控制的方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)