本发明涉及自然语言处理和深度学习技术领域,特别涉及一种基于句子级文档分割的长文本阅读理解方法。本发明的主要技术方案包括:S1、将文档进行分段;包括:将文档以句子为单位进行切分,并将切分后的句子按照在原文中的顺序放入集合S中,取前N句话拼接成初始文档分段并利用编码器进行编码;通过强化学习模型动态地调整文档分段的初始位置,得到文档的分段结果;S2、将文档分段与问题进行拼接输入答案抽取模型,输出每个字作为答案起始位置和终止位置的概率,并预测分段包含答案的概率,由三个概率值共同决定最终答案。通过本发明,使得文档分段在保留完整句子的基础上,尽可能地将完整的答案包含在内,并提升了答案抽取的准确性。
声明:
“基于句子级文档分割的长文本阅读理解方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)