本发明公布了一种并行优化的强化学习自适应PID控制方法,其特征在于包括以下步骤:步骤S1:运用matlab软件,通过零阶保持器法将传递函数离散化,初始化控制器参数和M个控制线程进行并行学习;步骤S2:定义输入信号传递给S1中的传递函数,计算输出值,将输入与输出信号的差值作为控制算法的输入向量;步骤S3:将输入向量传递给改进的自适应PID控制器进行训练,迭代N次后得到训练好的模型;步骤S4:使用训练好的模型进行控制测试,记录输入、输出信号,PID参数的变化值;步骤S5:可视化测试数据,控制效果对比。该发明较好地解决了以往自适应PID存在的问题,利用A3C学习的多线程并行学习的特性,提高了算法的稳定性和学习效率。
声明:
“并行优化的强化学习自适应PID控制方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)