本发明公开了一种基于强化学习的烟叶容重测量方法,包括:构建基于强化学习的烟叶容重测量模型:以包含烟叶流量、加水量、筒温、热风温度、蒸汽质量流量、出口水分和温度的回潮滚筒的相关参数作为状态数据,采用强化学习算法中的动作网络依据状态数据推算得到烟叶容重测量值,并根据烟叶容重测量值与烟叶容重实际值计算动作奖励值,并依据该动作奖励值构建TD误差,依据TD误差来构建动作网络和强化学习算法中的评价网络的损失函数,依据损失函数优化更新动作网络和评价网络参数,优化结束后,参数确定的动作网络作为烟叶容重测量模型;应用时,烟叶容重测量模型依据实时采集的回潮滚筒的相关参数实时推算输出烟丝容重测量值。
声明:
“基于强化学习的烟叶容重测量方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)