现代自适应雷达具备自主模式切换和快速波形捷变能力,导致雷达信号状态难以穷举,传统干扰方式效能下降。本发明实例研究了一种基于强化学习的干扰信号波形优化方法:首先对干扰决策过程进行马尔可夫建模,在此基础上构建双层强化学习模型,通过两个交互的Q‑learning对干扰样式和波形参数进行联合优化。对抗过程中,在每段波束驻留时间内,对雷达信号进行工作模式检测,外层Q‑learning据此进行干扰样式决策,并映射至时、频域两个内层Q表,其次评估干扰效果并更新外层Q表。而后对该波束驻留时间内的每个雷达脉冲进行参数估计,在干扰样式的约束下基于内层Q‑learning求解时、频域干扰波形参数,生成干扰信号。最后计算时、频域有效干扰系数,更新内层Q表。
声明:
“基于强化学习的干扰信号波形优化方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)