本发明公开了一种基于强化学习训练施工管理决策模型的方法,包括:获取目标施工项目的初始施工参数和所述目标施工项目所在地区的历史环境参数;其中,所述目标施工项目为待规划工人工时和物料购买量的施工项目;以所述初始施工参数和所述历史环境参数为基础数据构造出施工项目模拟器;根据所述施工项目模拟器模拟出与施工过程相关的观测轨迹、行动轨迹、状态轨迹和激励序列;根据所述观测轨迹、所述行动轨迹、所述状态轨迹和所述激励序列对预设结构的决策模型进行优化,以使优化后的决策模型可用于规划工人工时和物料购买量。本发明还公开了一种基于强化学习规划工人工时和物料购买量的方法、一种施工项目模拟器以及一种计算机可读存储介质。
声明:
“基于强化学习训练施工管理决策模型的方法和介质” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)