本发明涉及一种边缘计算环境下多目标任务调度方法及装置,其特征在于,其包括步骤:构建用于对边缘服务器中多个服务请求的执行顺序进行决策的指针网络模型,且使所述指针网络模型的结果取样策略将服务请求的平均等待时间作为优化指标;将边缘服务器的资源利用率与运行时间整合为一个优化目标作为强化学习的奖励函数对指针网络模型进行训练。本发明实施例将等待时间优化目标融合在模型决策内部,从而达到多目标优化的效果,不需要对权重取值进行大量的实验分析,对指针网络的模型训练更加有效。同时,基于强化学习的指针网络模型,无需像传统的启发式算法需要长时间迭代,可以做到迅速决策,符合边缘环境下对时延敏感的要求。
声明:
“边缘计算环境下多目标任务调度方法及装置” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)