本申请是关于一种基于对话的内容推荐方法、装置、计算机设备及存储介质,涉及人工智能交互技术领域。所述方法包括:获取与目标用户之间的历史对话语句;将历史对话语句,以及各个候选推荐内容输入至对话推荐模型,获得对话推荐预测结果;对话推荐模型的奖励函数的输入信息包括预测回复信息以及预测推荐结果;预测回复信息包括对话推荐模型在强化学习过程中产生的预测对话回复对应的信息;预测推荐结果指示对话推荐模型在强化学习过程中从各个候选推荐内容中预测出的目标推荐内容。该对话推荐模型的优化维度包含了对话推荐模型的对话回复,从而提高了对话推荐模型的优化效果,进而提高对话推荐模型应用时的对话推荐效果。
声明:
“基于对话的内容推荐方法、装置、计算机设备及存储介质” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)