本发明公开一种运动学约束条件下基于深度强化学习的UAV路径规划方法,具体步骤如下:S1:深度强化学习神经网络根据多个任务点以及静态障碍物的向量坐标得出最短路径;S2:无人机起飞后沿着最短路径飞行执行任务;S3:当探测到存在动态障碍物,无人机向基地发送信号,由超级计算机预测无人机接收信号时所在的位置;S4:根据动态障碍物以及剩余任务点的坐标使用深度强化学习神经网络输出得到新的飞行路径,并通过无线电将新的路径发送给无人机;S5:无人机沿着新的路径执行任务,执行完所有任务后最终返回基地。本发明提出了一种基于online和offline的框架,不仅解决了Q‑Learning中状态和动作都是高维的问题,而且在解决TSP问题的同时考虑运动学模型并避开动态障碍物。
声明:
“运动学约束条件下基于深度强化学习的UAV路径规划方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)