本发明公开了一种面向多无人机碰撞规避的深度强化学习训练加速方法,其包括:步骤S1:基于马尔可夫决策过程对完全分布式的无人机集群避障问题进行形式化建模;步骤S2:构建深度神经网络构建观测输入‑动作输出的映射、网络更新方法;步骤S3:融合人类经验以加速训练。本发明具有原理简单、训练智能化程度高、可加速深度强化学习训练过程等优点。
声明:
“面向多无人机碰撞规避的深度强化学习训练加速方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)