本申请实施例公开了一种内容推荐方法、模型训练方法、装置及电子设备,通过引入价值评估模型来得到样本推荐分值,使得决策模型与价值评估模型形成强化学习架构,可以提升决策模型的训练效果,提升利用决策模型在目标推荐位置进行内容推荐的准确性;并且,通过进一步引入点击率预测模型,即便是针对未被推荐过的样本内容,也能够更加准确地对样本内容被推荐后的点击率进行预测,提升对价值评估模型的训练效果,提升强化学习的效果,从而进一步提升决策模型的模型性能。后续在利用决策模型对目标对象进行内容推荐时,即便是针对未被推荐过的内容也能够有效地提升推荐的准确率,可以广泛应用于云技术、人工智能等领域。
声明:
“内容推荐方法、模型训练方法、装置及电子设备” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)