本发明提出了基于深度强化学习的盾构最优自主掘进控制方法。深度强化学习决策模块根据观测到的反馈的传感器实测参数,地质前勘测量的参数以及从奖励函数模块反馈的奖励函数值处理获得总推进力期望值和刀盘扭矩期望值;最优控制模块处理输出总推进力实际值和刀盘扭矩实际值;奖励函数模块生成奖励函数值,反馈到通过深度强化学习决策模块;最优控制模块输出的总推进力实际值和刀盘扭矩实际值施加到盾构机上,通过盾构环境交互模块处理获得经过盾构环境交互后的传感器实测参数。本发明减轻盾构司机的工作量,能够实现完全自主控制的基础上提升综合掘进性能,同时实现掘进参数的智能决策与长期综合掘进性能的多目标动态优化,显著提高综合掘进性能。
声明:
“基于深度强化学习的盾构最优自主掘进控制方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)