本申请提供一种基于深度强化学习的认知无线网络动态频谱接入方法,包括:对预先提出的动态频谱接入问题进行建模和分析;预先构建双深度强化学习网络模型;根据第一深度强化学习网络模型,获取系统模型中次用户基于动态频谱接入策略的所有动态频谱接入动作的Q值;各个次用户选择Q值最优状态下次用户的动态频谱接入动作;根据选择的次用户的动态频谱接入动作选择第二深度强化学习网络模型的目标Q值;计算损失函数,通过最小化损失函数训练双深度强化学习网络模型,并更新双深度强化学习网络模型的权重。本申请满足多用户多信道认知无线网络中大状态动作空间的高计算需求,利用过去观测来预测现实状态,加快收敛速度并提高预测精度。
声明:
“基于深度强化学习的认知无线网络动态频谱接入方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)