本申请是对话信息获取方法、装置、设备及存储介质,涉及人工智能技术领域。所述方法包括:获取第一对话信息;基于第一对话信息,通过第一对话模型进行数据处理,获得第二对话信息;基于第一对话信息以及第二对话信息,通过第一判别器进行数据处理,获得第一置信分数;基于第一置信分数,对第一对话模型进行参数更新。上述方案,训练好的判别器可以对输入第一对话模型的第一对话信息,以及第一对话模型输出的第二对话信息之间的匹配度进行检测,并将匹配分数作为奖励值,且每一轮对话都可以获得该轮对话对应的奖励值,提高了奖励值产生的密度,从而提高了通过强化学习训练得到的第一对话模型的训练效率。
声明:
“对话信息获取方法、装置、设备及存储介质” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)