本发明公开的一种基于Q‑Learning的深空探测器任务规划方法,属于航空航天技术领域。本发明将结构化表达方法表达的状态空间本身和状态的转移,以Q‑Learning方法识别的扁平化数值、向量和矩阵形式输入强化学习的训练过程,完成Q‑Learning方法对规划的训练,能够提升对突发事件适应性的基础上,提升小行星探测任务规划、转移效率。本发明采用向量和矩阵表达规划中的状态和动作关系,能够很好的表达规划中状态空间各状态以及各状态之间的转移方式、转移条件和转移效果,进而提高小行星探测任务轨道转移精度。本发明训练之后的模型拥有快速获得规划解和从其它初始状态开始规划的能力,提升规划效率和规划过程的鲁棒性。
声明:
“基于Q-Learning的深空探测器任务规划方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)