本发明公开一种从研究文献中提取天然产物数据信息的方法,包括:对研究文献文本内容进行预处理,以得到多个预处理语句;从所述多个预处理语句中获取生物物种描述语句和化学成分描述语句;从所述生物物种描述语句中获取生物物种信息;从所述化学成分描述语句中获取化学物质信息;至少关联存储所述生物物种信息和所述化学物质信息。本申请实施例自动分析天然产物研究文献的文本内容,并自动识别和提取其中的天然产物化学成分数据信息,用于计算机大规模批量生产具有科学研究价值的天然产物数据,从而避免人工标引数据周期长、成本高等缺陷,达到短时间、低消耗获取一定规模天然产物化学成分数据集的目的。
声明:
“从研究文献中提取天然产物数据信息的方法及系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)