本发明涉及知识图谱技术领域,提供了一种基于语言统计模型的地质领域文献图谱生成方法。其旨在发现同类信息(这里是地质学金矿领域内信息)之间的关联性,构建的图谱创新点在于金矿领域内的知识,采用文献进行构建。其主要方案包括:分词操作,进行词性过滤操作,得到仅剩下名词、动词、介词的主干句子,对主干句子进行动词过滤操作,得到不以人为主语的及物动词的句子。对上一步的结果进行关系二元组抽取操作,并计算概率每一个关系二元组均有一个概率p。将相同的关系词拼接,根据概率p计算组成的关系三元组的概率P。对关系三元组进行关系词过滤及概率排序操作得到关系三元组列表,对关系三元组进行图谱生成。
声明:
“基于语言统计模型的地质领域文献图谱生成方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)