本申请实施例公开了用于生成模型的方法和装置。该方法的一具体实施方式包括:获取样本集,样本集中包括样本语句以及与样本语句对应的标注知识;从样本集中选取样本,以及执行以下训练步骤:样本语句输入第一初始模型,生成与样本语句对应的第一预测知识;将第一预测知识输入第二初始模型,生成与第一预测知识对应的第一预测语句;将标注知识输入第二初始模型,生成与标注知识对应的第二预测语句;将第二预测语句输入第一初始模型,生成与第二预测语句对应的第二预测知识;确定第一奖励信号;根据所确定的第一奖励信号利用强化学习方法训练得出第一模型。该实施方式丰富了模型的生成方式。
声明:
“用于生成模型的方法和装置” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)