本发明涉及一种基于强化学习的空间机器人捕获翻滚目标运动规划方法,包括设计了用以学习训练的智能体状态与动作具体形式,与到达任务的奖励函数;基于优先回放的DDPG算法改进;应用改进的DDPG算法进行抓捕任务的训练过程。本发明的有益效果是,不再需要对空间机器人与非合作环境进行精确建模,仅在观测特定状态的情况下进行智能算法的学习训练,即可对空间机器人抓捕非合作目标进行运动规划。其学习到的策略可以应对一定程度的观测噪声,使得机器人可以智能、自主地抓捕目标。
声明:
“基于强化学习的空间机器人捕获翻滚目标运动规划方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)