本发明涉及一种多节点探测器着陆行为智能规划及决策方法,属于航天器控制和人工智能技术领域。本发明利用多智能体强化学习来端到端地完成探测器着陆行为规划决策,采用“集中训练分布执行”的训练范式,智能体以局部观测作为Actor网络的输入,以全局观测作为Critic网络的输入,达到了智能体之间信息交互的目的。同时,本发明将基于模型的元学习方法融入本发明方法中,在Actor和Critic网络中嵌入GRU模块实现历史经验的存储与利用,使智能体在面对不确定环境时具有更好的鲁棒性,最终使获得的策略能够指导探测器各节点应对不确知的小行星环境,显著降低了探测器着陆时发生反弹、滚转、倾覆的概率。
声明:
“多节点探测器着陆行为智能规划及决策方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)