本发明公开了基于深度森林的蛋白质‑蛋白质相互作用预测方法,属于生物信息技术领域。所述方法融合伪氨基酸组成、自相关描述符、互信息描述符、组成、分布和转化描述符、氨基酸组成位置特异性得分矩阵和二肽组成位置特异性得分矩阵将蛋白质序列转化为数值向量,融合蛋白质对的序列信息、物理化学性质信息和进化信息作为样本的初始特征;使用弹性网进行特征选择,剔除冗余和不相关的特征;将融合后的最优特征向量输入到构建的多粒度级联深度森林中,预测蛋白质‑蛋白质相互作用。本发明简单有效,深度森林能够表征蛋白质对的高水平特征信息,在训练集和测试集上的结果明显优于其它预测方法,可以为药物靶点预测和人类疾病治疗提供一定借鉴。
声明:
“基于深度森林的蛋白质-蛋白质相互作用预测方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)