本发明公开了一种基于深度强化学习的实时拥塞控制方法,涉及计算机网络与人工智能的交叉领域。该方法包括构建仿真网络,在仿真网络中按照设定的每回合时间长度,来构建数据传输程序;初始化强化学习智能体及内部神经网络,采集网络统计信息及动作滞后时间以训练滞后预测模型,接着固定滞后预测模型,用强化学习算法训练神经网络,最后将神经网络模型部署至目标网络环境中,让智能体能根据当前的网络状态数据动态地调整拥塞控制窗口的大小,在数据传输过程中取得更高的吞吐量和更低的往返时延。本发明以扩展状态空间和单独预测滞后时间的方式解决了应用深度强化学习至拥塞控制时的动作滞后问题,可以兼顾拥塞控制效果和较高的网络性能。
声明:
“基于深度强化学习的实时拥塞控制方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)