一种基于深度强化学习的水下自主航行器动态避障方法,涉及水下机器人避障技术领域。本发明是为了解决目前缺乏水下自主航行器对动态障碍物的避障研究的问题。本发明建立水下自主航行器模型与运动学模型,获取周围障碍物的信息;采集水下自主航行器周围机动障碍物的运动状态信息,并构造动态障碍物状态方程;根据动态障碍物状态方程预测动态障碍物运动学模型;根据水下自主航行器周围障碍物的信息和动态障碍物运动学模型,融合多动态障碍物避障法生成避障策略并转化为MDP模型;结合确定性深度策略梯度算法对MDP模型进行训练,直至水下自主航行器能够无碰撞的到达目标区域;利用训练好的MDP模型引导水下自主航行器航行。
声明:
“基于深度强化学习的水下自主航行器动态避障方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)