本发明实施例提供一种面向空间博弈的策略梯度强化学习自主驱离策略,包括:选取一护卫星作为第一航天器和第二航天器的参照点,获取第二航天器的预定的水滴运动轨迹,在仿真环境中建立CW轨道相对运动学模型;获取t0时刻第一航天器和第二航天器的观测量,根据所述水滴运动轨迹获取所述第二航天器的速度增量;将t0时刻第一航天器的观测量输入训练效果收敛的动作网络计算t0时刻所述第一航天器的速度增量,进行轨道控制;计算t0+T时刻第一航天器观测量,根据所述t0时刻第二航天器的速度增量计算t0+T时刻第二航天器的观测量;根据t0+T时刻第一航天器和第二航天器的观测量计算距离并进行驱离判定。利用本发明实施例提供的技术方案可以实现航天器之间的准确驱离控制及判定。
声明:
“面向空间博弈的自主驱离方法、装置和存储介质” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)