本发明提供一种基于一致性文本增强的远程监督关系抽取方法及装置,该方法包括:按实体对和关系标签对多个句子实例进行划分,得到多个句子包;对每个句子包中的每个句子实例采用不同的文本增强方法,得到每个句子包中的每个句子实例对应的强增强样本以及弱增强样本;确定噪声样例,并通过无关系句子实例以及噪声样例的强增强样本和弱增强样本对关系预测模型进行训练,得到训练好的关系预测模型;利用训练好的关系预测模型对待预测的句子包进行预测,获得与其对应的关系标签。通过本发明,通过一致性文本增强,能够增加数据集规模,增强模型的泛化学习能力,让“NA”类别和噪音样例约束模型学习更多的监督信息。
声明:
“基于一致性文本增强的远程监督关系抽取方法及装置” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)