本发明涉及一种面向无人机图像导航的深度强化学习加速训练方法,包括物体检测模型的训练和动作选择策略的训练。其中,动作选择策略的训练是根据物体检测模型的模拟输出值并通过深度强化学习方法进行的。在基于图像的深度强化学习方法的训练中使用图像检测模型的模拟输出值代替图像检测模型的输出值来加速训练,该方法有如下优势:减少训练耗时,降低GPU使用率及显存占比和通用性较强。
声明:
“面向无人机图像导航的深度强化学习加速训练方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)