一种基于多智能体深度强化学习的车联网边缘缓存方法,通过以下步骤实现,第1、系统模型与数学模型的构建;第2、建立基于多智能体的执行者‑评价家结构的协同内容分发的边缘缓存策略。本发明首先采用Zipf分布请求内容,每个智能体根据自己的策略网络及其过程中的噪声选择相应动作并执行,之后判断是否超出缓存,超出则删除流行度较低内容。然后,每个智能体获得环境奖励,获得新的观测空间,并将相应数据放入经验池中。最后,更新每个智能体的目标网络参数。结果表明本方法所提出的车联网边缘缓存方案与其他方法相比,在减少内容内容分发过程中的时延、提高内容命中率和成功率方面有较好的表现。
声明:
“基于多智能体深度强化学习的车联网边缘缓存方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)