一种基于强化学习的行星软着陆控制方法及系统和存储介质,涉及软着陆轨迹优化与控制领域,为了解决现有的行星软着陆控制存在无法保证制导律最优、模型较复杂,训练难以收敛等问题。本发明包括:一:基于着陆器的硬件构型和发动机动力配置等特征,建立着陆器动力下降段六自由度动力学模型;二:设计训练交互环境的奖励函数、观测空间、动作空间和神经网络结构;三:数值仿真环境的搭建,利用强化学习算法训练得到软着陆控制器;四:通过速度跟踪测试和软着陆测试对训练控制效果评估。通过执行步骤一和步骤二获得软着陆强化学习环境模型,智能体与环境模型交互,从而获得训练数据。通过步骤三训练可以得到软着陆控制器,最后通过步骤四挑选出表现最佳的训练结果,作为最优软着陆控制器。本发明用于软着陆轨迹优化与控制。
声明:
“基于强化学习的行星软着陆控制方法及系统和存储介质” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)