本发明提出一种基于SMILES的机器学习方法,包括:将SMILES字符串转化为多个BASE64字符;通过One‑Hot编码获取该BASE64字符的向量矩阵;将该向量矩阵作为训练集,对机器学习模型训练以进行化学任务。以及一种基于SMILES的机器学习系统,和一种数据处理装置。采用了本方法预处理后得到的字符串相较于原SMILES包含了更多的信息,其不仅包含字符信息还包含字符之间的隐含信息。将本方法应用到基于SMILES的新型分子设计、分子属性预测等化学任务中时,可以提取出更多的分子特征,提高了模型重构分子及分子属性预测的精度。
声明:
“基于SMILES的机器学习方法及系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)