利用深度强化学习的可变构航天器在轨自变构规划方法,本发明涉及可变构航天器在轨自变构规划方法。本发明的目的是为了解决现有方法对于稍微复杂的构型,算法复杂度大;无法进行规划的问题。过程为:S1:初始化均值和目标网络的参数;S2:根据目标网络选择组成自变构卫星的可动模块动作;S3:化解碰撞冲突;S4:监测S3动作执行后运动模块的状态改变;S5:获取每个模块执行动作的收益;S6:选取模块执行动作获得的经验,存储在内存中;S7:从内存中选取样本输入均值网络,得到训练好的均值网络;S8:将参数复制到目标网络中进行更新;目标网络输入为模块状态、动作,输出动作价值函数。本发明用于航天器在轨自变构规划领域。
声明:
“利用深度强化学习的可变构航天器在轨自变构规划方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)