本发明公开了一种基于记忆增强学习的无人机自主避障导航方法,克服了传统深度强化学习导航方法在部分可测环境中极易陷入局部困境的问题。首先把无人机自主避障导航问题建模为目标驱动的马尔可夫决策过程,提出动态相对目标的目标特征提取方法,引导无人机学习导航问题的本质特征;然后考虑到传统导航方法由于没有保存历史信息,导致无人机在部分可测环境中极易陷入局部困境,本发明设计了一种保存动作记忆和空间信息的记忆增强模块,在决策时额外考虑历史的观测以及动作序列,使无人机更易脱离困境;最后本发明提出基于高斯分布探索增强的深度强化学习算法,使其能够在提高算法收敛速度的前提下保持并提高无人机避障导航的成功率。
声明:
“基于记忆增强学习的无人机自主避障导航方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)