本申请涉及化学技术领域,公开了一种构建方法、分析方法、装置、存储介质和计算机设备,其中,构建方法包括:获取多个化合物样本的SMILES序列;对所述多个化合物样本的SMILES序列进行拼接处理,确定拼接SMILES序列;根据训练样本序列对BERT模型进行训练,构建所述预训练模型,所述训练样本序列包括所述多个化合物样本的SMILES序列和所述拼接SMILES序列。本申请的方法,能够从无标签的样本数据对BERT模型进行有监督学习得到相应的机器学习模型,不仅节约模型训练时间,而且模型泛化能力较强。
声明:
“构建方法、分析方法、装置、存储介质和计算机设备” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)