本发明提供一种基于深度学习的TCP拥塞动态控制方法及装置,包括:代理获取传输环境的状态按照策略确定一个动作,动作为TCP会话的数据传输动作;传输环境基于动作对下一个传输环境进行改变,并将改变后的环境信息作为回报传输至代理;获取时序上连续的K个历史经验,对所述K个历史经验进行处理后作为输入至时序卷积网络模型中得到历史信息;代理基于所述历史信息以及回报和或累积回报确定下一个动作。基于深度强化学习通过挖掘网络历史经验为处理网络拥塞提供了一种新的方案,通过实验分析历史经验K的取值,并进行调整进行动作的改变,使得本发明能够在瓶颈链路带宽较小的网络中部署TRL‑CC,TRL‑CC较NewReno和RL‑CC在吞吐量和延迟方面达到了更好的性能。
声明:
“基于深度学习的TCP拥塞动态控制方法及装置” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)