本公开公开了一种信息推送方法、装置、电子设备及计算机可读存储介质,其中,所述方法包括:当检测到产生信息时,采集信息对应的特征数据,根据特征数据生成当前状态,并根据推送信息生成第一当前动作;将当前状态和第一当前动作输入线上深度强化学习模型,以使线上深度强化学习模型根据当前状态和第一当前动作获取推送信息时对应的分值;若推送信息时对应的分值大于预设分值,则推送信息。本公开通过采集产生的信息对应的特征数据,根据特征数据生成当前状态,并根据推送信息生成第一当前动作,将当前状态和第一当前动作输入线上深度强化学习模型,获取推送信息时对应的分值,若推送信息时对应的分值大于预设分值,则推送信息,可以提高推送准确率,从而提高用户对信息的点击率。
声明:
“信息推送方法及装置” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)