本发明公开了一种基于SHAP值构建可解释的XGBoost回归模型加速发现高PCE的N‑P类有机敏化剂的QSPR方法及系统,建立数据集样本;切分分子片段;Chem3D优化分子;生成描述符;随机划分训练集和测试集;利用SHAP嵌套XGBoost筛选变量,选出XGBoost建模的最优变量子集;用XGBoost回归建立N‑P类有机敏化剂的快速预报模型;根据建立的模型,快速预报测试集染料分子的PCE。根据SHAP反馈的对目标特征的影响和参考文献解释描述符,对应分子片段的结构,构建QSPR模型;python生成大量虚拟样本,利用建好的XGBoost模型进行预报。本发明基于可靠的文献真实值和建模方法,所建的N‑P类有机敏化剂的XGBoost预报模型具有方便快捷,无化学污染的优点。
声明:
“基于SHAP值构建可解释的XGBoost回归模型预测PCE的QSPR方法及其系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)