本发明涉及一种多任务深度强化学习的深空探测器软着陆路径规划方法,属于人工智能与深空探测技术领域。本发明基于深度确定性策略强化学习算法DDPG,采用多任务学习,充分利用智能体之间的对抗与协作关系,提升了每个智能体应对不确定情况的能力,提高模型整体的泛化性能。通过采用融合时间上下文信息的自注意力机制,不仅避免智能体陷入局部最优状态,而且使智能体更加聚焦到有利于自身获得最大回报的信息进行学习,进一步提高探测器着陆的成功率。本方法能够实现深空探测器的稳定着陆,为后续实现小行星探测、自主取样和航天员登陆活动奠定基础。
声明:
“多任务深度强化学习的深空探测器软着陆路径规划方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)