本发明实施例提供了一种用于环境监测与控制的强化学习方法及系统,方法包括:将现场实际环境映射为学习模型,所述学习模型是根据所述现场实际环境中智能体的状态、动作以及学习目标建立的;基于强化学习后的所述学习模型,对所述实际环境进行监测与控制,其中,所述强化学习后的所述学习模型是通过在线的全连接深度网络强化学习得到的。本发明实施例提供的一种用于环境监测与控制的强化学习方法及系统,通过在线的全连接深度网络强化学习方法智能实时对环境进行监测与控制,满足不同环境下的不同需求,降低运行成本具有自适应和预测能力,可应对各种复杂的展厅环境。
声明:
“用于环境监测与控制的强化学习方法及系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)