本发明公开一种基于深度强化学习的频谱资源管理方法。主要解决现有技术不能有效利用不完全信道状态信息进行频谱和功率分配以及频谱资源管理多目标优化的问题。其实现方案是,以频谱效率最大化为优化目标,构造以信道增益和噪声功率为权值参数的自适应深度神经网络;初始化权值参数,观测用户接入信息和干扰信息,根据通信网络能量效率和公平性计算损失函数,沿着损失函数梯度下降方向逐层更新信道增益和噪声功率,反复训练自适应深度神经网络,当满足训练结束条件,输出最优频谱资源管理策略。本发明能基于不完全信道状态信息得到最优频谱资源管理策略,有效提升了通信网络的频谱效率、能量效率和公平性,可用于无线通信中的频谱和功率分配。
声明:
“基于深度强化学习的频谱资源管理方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)