本发明公布了一种数据驱动的多智能体系统PID控制协议自学习方法,本发明针对PID控制的多智能体系统,提出最优一致性问题;将求解基于PID控制的控制协议参数转化为求解一个非零和博弈问题,提出了一种非策略Q学习算法,实现PID控制协议参数在线自学习以及多智能体系统的最优一致性;将强化学习(RL)技术和神经网络函数估计方法相结合,不要求智能体系统动态已知,完全利用可测量数据自学习PID控制协议参数。本发明方法不需要知道多智能体系统的动力学模型,就能使所有智能体达到一致状态,即达到一致性,同时能保证多智能体规定性能的最优性。
声明:
“数据驱动的多智能体系统PID控制协议自学习方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)