本发明涉及一种基于复杂抽样和改进决策森林算法的化合物致癌毒性预测方法,适用于根据有机小分子结构信息对该化合物进行计算致癌毒性评价和虚拟筛选。首先对分子结构分子采用相关力场进行优化并进行电荷计算,对初始训练集中的化合物进行复杂抽样用于训练子集的产生,并根据复杂抽样算法结果固定描述符的组成计算分子中的各种相关描述符;然后使用基于相关矩阵分析和因子分析方法优化描述符池;最后使用改进的决策森林方法对训练集分子的致癌毒性数据和及其相应化学表征进行数据挖掘,得到分类的预测可信区间,致癌毒性预测模型和判断规则。该方法在高通量虚拟筛选和计算致癌毒性评价中具有良好应用前景。
声明:
“基于复杂抽样和改进决策森林算法的化合物致癌毒性预测方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)