本发明提供一种用于航空领域的知识元抽取方法,具体实施步骤包括:将航空领域的结构化标注数据输入到Bert模型,输出结构化标注数据的特征向量;将输出的特征向量和Word2Vec模型学习到的特征向量进行融合,并做Concat叠加步骤;将得到的字向量输入到层次归一化层,得到标准化的字向量;利用高层强化学习过程对得到的每个字向量进行解码,按句识别字向量中的关系触发词;建立面向航空领域长实体的头尾指针模型,得到预测出的关系和尾实体起止位置序列;将预测出的实体输出后,根据实体的标签信息进行就近原则以及匹配方式进行匹配。本发明面向航空领域,基于郑码、五笔、拼音和笔画等特征融入的方式,与Bert输出的向量相结合,提升了准确率与召回率。
声明:
“用于航空领域的知识元抽取方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)