本发明提供一种化学表达式提取方法、装置及设备,涉及数据处理技术领域。本发明可以通过获取化学题文本数据,对化学题文本数据进行分词操作,得到化学题文本数据对应的至少一个分词,并确定至少一个分词中,与预设的化学表达式聚类中心之间的距离小于预设阈值的分词为目标分词,然后提取目标分词,可以得到化学题文本数据中的化学表达式,从而实现基于聚类分析从化学题文本数据中提取化学表达式。相对于现有的化学表达式提取方法而言,可以有效减少人工标注过程所耗费的大量的时间和成本,另外,还可以有效提高化学表达式提取的速度。
声明:
“化学表达式提取方法、装置及设备” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)