本说明书公开了一种强化学习模型训练以及确定数据关系的方法及装置,通过遮盖由知识图谱确定出的三元组中的实体得到各提示模板,将被遮盖的实体作为对应的标注答案。通过预训练语言模型,确定各提示模板的被遮盖的实体的各预测结果以及置信度,并确定各预测结果与该知识图谱中信息的相似度特征向量。然后基于置信度大小,根据各预测结果的相似度特征向量,通过待训练的强化学习模型,确定该提示模板的预测实体,并据该预测实体和标注答案确定奖励,以对该强化学习模型进行训练。通过知识图谱确定提示模板,避免了上下文语境对预训练语言模型预测准确度的影响,后续通过强化学习模型结合知识图谱对各预测结果进行筛选,确定更准确的预测实体。
声明:
“强化学习模型训练以及确定数据关系的方法及装置” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)