本发明涉及一种基于深度强化学习的宽带无线通信自主选频方法及系统。该方法包括:获取宽带OFDM波形信道;将宽带OFDM波形信道划分为多个独立子信道;将各独立子信道进行感知,将感知结果作为深度强化学习的环境状态信息;获取通信系统的待优化参数,将待优化参数的组合作为深度强化学习的动作空间,动作空间包含多个决策目标;构建深度强化学习神经网络;将环境状态信息作为深度强化学习神经网络的输入,决策目标作为深度强化学习神经网络的输出,对深度强化学习神经网络进行训练,得到训练后的深度强化学习神经网络;根据训练后的深度强化学习神经网络对待预测宽带OFDM波形信道进行自主选频,得到最优信道。本发明能够提高抗干扰能力。
声明:
“基于深度强化学习的宽带无线通信自主选频方法及系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)