本发明公开一种基于深度强化学习的流水线并行训练任务分配方法,步骤为:初始化深度学习模型,并把该模型载入;建立对目标深度学习模型运行时分析方案,构建模型参数文本库;根据获取的模型参数文本信息,构建任务分配预测网络;使用策略梯度训练预测网络,直至生成最优流水线并行任务分配方案;按照生成的最优任务分配方案,在异构计算节点中部署模型,完成训练任务。本发明有效避免节点计算能力和网络带宽差差异带来的负载不均衡问题,提高模型训练速度,并且模型参数越大,提升效果越明显。
声明:
“基于深度强化学习的流水线并行训练任务分配方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)