本发明提供一种基于强化学习的
浓密机在线控制方法,能够降低时间消耗,并提高控制精度。所述方法包括:获取生产过程中所监测到的历史记录数据;建立由模型网络和评价网络组成的双网结构的控制模型,并利用获取到的历史记录数据对所述模型网络和评价网络进行训练;通过训练好的模型网络预测下一时刻的底流浓度和泥层高度,且训练好的评价网络根据预测到的所述下一时刻的底流浓度、泥层高度,估计所述下一时刻的累计代价值,根据估计得到的下一时刻的累计代价值,计算当前时刻的累计代价值,根据得到的当前时刻的累计代价值,利用梯度下降迭代算法确定当前时刻最优控制动作:底流泵速、絮凝剂泵速。本发明涉及
采矿领域。
声明:
“基于强化学习的浓密机在线控制方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)