本发明公开了一种基于深度强化学习的无线网络拥塞控制方法,属于无线网络资源管理以及强化学习领域。该方法包括:无线接入网信息预测网络的初始化和预训练,奖励函数再分配网络的初始化和预训练,动作控制网络、价值评价网络和表示网络的初始化和训练,最后实现无线网络拥塞控制。本发明得到的拥塞控制方法相较于以往的传统拥塞控制方法,能得到更高的吞吐量和更低的往返时间,并具有更好的公平性。
声明:
“基于深度强化学习的无线网络拥塞控制方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)