本发明公开了一种基于深度强化学习的反应温度控制方法和系统,该控制方法通过温度控制模型输出用于调整加热时间和温度的控制参数,其温度控制模型基于柔性动作评价算法框架建立,可以通过深度强化学习的方式对温度控制模型内部的策略网络进行权重更新,使得在经过多次迭代学习后,策略网络可以具备更好地预测准确性,从而提高控制参数输出的合理性,同时使评价网络所输出的评价值可以在该过程中对策略网络输出的控制参数进行准确的评价,反向地对控制参数的调整作出指导,最终的目的均是使得控制参数可以更为准确地控制加热设备,从而使胶体金制备过程中的温度可以实现动态的稳定,减少外界因素的干扰,从而达到最优的制备效果。
声明:
“基于深度强化学习的反应温度控制方法和系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)