本发明公开了一种基于强化学习的高超声速飞行器航迹规划方法,本发明根据航迹规划分2个阶段:离线训练阶段,训练一个不依赖于固定环境的RL智能体作为航迹规划的基线策略;在线规划阶段,RL‑CEM利用环境模拟器预测未来的状态进行规划,之后选择优于基线策略的策略作为执行策略,否则将使用基线策略。本发明提出的RL‑CEM不仅有效地回避航迹规划中的局部最优,还展现出了令人满意的成功率。RL‑CEM弥补了以往基于RL的航迹规划方法容易陷入局部最优、规划失败时无替代方案的缺点。本发明的航迹规划方法回避了高超声速飞行器复杂的动力学,仅通过其运动学来解决该问题。
声明:
“基于强化学习的高超声速飞行器航迹规划方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)