本说明书实施例提供一种通过强化学习模型对业务模型进行压缩的方法和装置。方法包括,首先获取通过神经网络实现的业务模型,其包含N个网络层。依次将各个网络层作为当前层进行剪枝操作,该操作包括,基于当前层的层特征确定环境状态,将环境状态输入强化学习模型,得到针对当前层的剪枝决策,据此进行剪枝;并在样本队列中添加当前层的剪枝记录,该记录包括环境状态和剪枝决策。然后,将验证数据集输入N个网络层均进行剪枝后的压缩模型,得到性能评估结果。根据该性能评估结果确定奖励分数,将奖励分数分别添加到N条剪枝记录中,形成N条训练样本。然后,根据样本队列中的训练样本,更新强化学习模型。
声明:
“通过强化学习模型对业务预测模型进行压缩的方法和装置” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)