针对当前反无人机系统单一拦截装备在暂时性的任务分配中无法有效压制无人机的问题,本发明公开了一种基于强化学习的反无人机任务分配方法,包括:对改进的DQN算法初始化,改进的DQN算法是指相对于DQN算法,采用当前时刻的状态来预测Q值;通过改进的DQN算法完成智能体的训练与优化,在智能体训练完备之后保存网络参数;将无人机状态信息S输入强化学习模块,通过强化学习输出次优解X,即初期的分配策略;通过进化算法对强化学习生成的次优解进行优化,生成目标分配的最优解;对所述的最优解进行解码,获得反无人机的任务分配方案。本发明中通过改进的DQN算法训练的智能体拦截表现更为精确,任务分配更加高效且适用。
声明:
“基于强化学习的反无人机任务分配方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)