本发明提供一种基于深度强化学习的无人机中继抗干扰方法,包括:步骤1、搭建无人机协作通信网络,包括地面节点、源无人机、中继无人机、智能干扰机和固定干扰机;步骤2、将观察到的当前时隙的状态作为目标Q神经网络的输入,分析后得到所有动作的Q值,根据ε‑greedy策略来选择当前时隙的动作,计算当前时隙下的误比特率、信号干扰噪声比、中断率和效益,观察下一个时隙的状态,将经验e存放到经验池中,从经验池中随机抽取若干个经验更新Q神经网络参数θ;步骤3、依次对划分的时隙执行步骤2中的操作,并在每间隔固定时隙T更新一次目标Q网络的参数采用本发明上述方法可降低通信系统的误比特率和中断率,提高抗干扰性能,降低源无人机的能耗。
声明:
“基于深度强化学习的无人机中继抗干扰方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)