本发明公开了一种场景快变条件下的多飞行器自主决策方法,属于飞行器技术领域;所述的场景快变条件下的多飞行器自主决策方法,具体为:首先,每个飞行器分别搭载一个激光雷达进行目标探测,根据返回的三维点云数据,识别探测范围内的静态障碍物或其他飞行器;然后利用飞行器的三维点云数据构建自主冲突解脱模型;基于多智能体强化学习框架进行求解,得到根据输入状态选择动作的奖励函数;最后,神经网络学习模块基于奖励函数进行中心化训练和非中心化执行,通过收敛的神经网络计算出基于某状态的所有可采取的动作值,并根据组合优化求解多智能体行为动作。本发明当场景信息改变时可利用迁移学习技术进行继承训练,迁移性较好。
声明:
“场景快变条件下的多飞行器自主决策方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)