一种基于深度策略性梯度强化学习的在线轨迹生成制导方法,属于轨迹生成技术领域。方法如下:建立无量纲化的动力学模型,并将过程约束转化为倾侧角约束;设计攻角剖面和倾侧角剖面形式;设定强化学习要素;建立actor‑critic架构的智能体;提取智能体的online‑actor网络参数并进行固定。本发明能够有效的在可重复使用运载器的滑翔段大扰动条件下生成再入轨迹;解决了传统再入飞行器轨迹制导方法对强扰动条件适应性不足,难以满足多个终端约束的问题。可通过对再入飞行攻角和倾侧角剖面的周期性预测,满足再入飞行终端高度、航程和速度约束。较传统跟踪制导方法有较大的精度提升,算法计算量小,具有较好的应用前景。
声明:
“基于深度策略性梯度强化学习的在线轨迹生成制导方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)