本发明提供一种对话推荐方法,装置、电子设备及介质,采用历史序列提升推荐效率,方法包括:获取用户与项目之间的历史交互序列,并将历史交互序列输入至包含嵌入层、自注意块及预测层的推荐网络模型中进行训练,生成项目偏好值;其中,项目包含项目属性;利用项目偏好值及用户未交互过的项目生成候选项目集;当接收到用户发送的偏好项目属性时,利用偏好项目属性更新候选项目集,并利用项目相关值计算更新后的候选项目集中各候选项目的交互预测值;利用交互预测值及候选项目生成候选属性集,并利用交互预测值计算候选属性集中各候选项目属性的偏好预测值;将完成计算后的候选项目集及候选属性集输入策略网络中进行强化学习,向用户进行对话推荐。
声明:
“对话推荐方法、装置、电子设备及存储介质” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)