本发明涉及段落类型识别方法及系统和文档结构识别方法及系统,其中,段落类型识别方法,包括:S1、根据预先设定的段落类型识别规则,判断文本中任一段落是否符合段落类型识别规则,获取判断结果;所述段落类型识别规则包括:第一级规则为规定段落类型识别规则判断先后顺序的优先级规则;第二级规则为段落识别关联准则;S2、根据所述判断结果和预先设定段落类型识别准则及第一编号确定所述段落的段落类型;所述第一编号与所述段落类型识别准则对应。解决了现有的地质资料段落类型识别方法中语料标注成本过高、语料库稀缺的问题。
声明:
“段落类型识别方法及系统和文档结构识别方法及系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)