本发明公开了一种基于ARS强化学习算法的行星飞行避障制导方法,首先设置飞行器动作空间、飞行器状态空间、奖励函数,然后设置ARS算法超参数,采用神经网络实现飞行器避障功能;运行ARS算法,与环境交互获取经验并不断更新神经网络,学习避障制导律;训练多个回合后算法收敛即获得避障制导律;当障碍物距离飞行器的距离在飞行器探测范围内时,将飞行器探测范围的边界圆作为探测边界,探测边界外为安全区,探测边界内为预警区;当飞行器在预警区内时需要启动避障制导律避障,否则正常飞行。本发明方法是一种相对简化的无模型强化学习算法,采用适宜解决连续行为问题的线性策略,具有较高的效率和鲁棒性。
声明:
“基于ARS强化学习算法的行星飞行避障制导方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)