本发明公开一种基于多智能体强化学习的时延容忍网络路由算法,其特征在于,步骤包括:一、将时延容忍网络节点进行Louvian分簇算法,提出了一种集中式加分布式的分层架构;二、结合正社会特性将DTN节点选择下一跳问题建模为分布式部分可观测马尔科夫决策过程(Dec‑POMDP)模型;与现有技术相比,本专利技术方案对比现有的基于社会属性的时延容忍网络路由方案,提出了一种分层架构,能够方便地捕捉边缘设备的社会信息;一方面分布式地执行计算中心下发的路由决策,另一方面在计算中心根据服务单元传来的状态集中式地训练路由算法。能够更有效地利用社会特性进行时延容忍网络中的路由转发,使得投递率提高和平均时延降低。
声明:
“基于多智能体强化学习的时延容忍网络路由算法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)