本发明公布了基于深度强化学习的无人机自主避障系统和方法,通过新颖的系统架构,将训练与决策分离,能够大幅降低训练时耗,提升飞行器决策时效;该自主避障方法采用基于策略迭代的深度强化学习模型,以无人机单目摄像机拍摄的以原始的RGB图像为训练数据,无需复杂的点云等其他3D信息,通过完全卷积神经网络对原始RGB图形进行训练获得深度图像信息,再通过基于策略迭代的强化学习方法对图像进行分析预测,提前预判出无人机下一时刻的飞行动作,实现自主避障。本发明提出的避障方法训练时耗比现有典型的基于值迭代的方法都更加高效、时耗更低,可实现灵活自主地避障,适用于变电站自动巡检、无人机巡航等高要求的自主避障场景。
声明:
“基于深度强化学习的无人机自主避障系统及方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)