本发明公开了一种基于深度学习的蛋白质相互作用位点预测方法,属于生物信息学分析技术领域,首先,从PDB数据库获取公开的蛋白质数据集,基于数据集中蛋白质的序列信息生成位置特异性得分矩阵并提取给定蛋白质序列的物理化学特征,从而形成蛋白质中每一个氨基酸残基的表示。由于蛋白质序列中非相互作用残基远远多于相互作用残基,采用下采样策略来消除类别不平衡性以获得高质量且低偏差的数据集。将平衡后的数据集分为训练集和测试集,对于训练集利用变分自编码器进一步提取蛋白质序列的高级抽象特征,再利用多层感知机对氨基酸残基进行分类。将训练好的模型在测试集上测试,得到预测结果。本发明计算成本低且预测精度较高。
声明:
“基于深度学习的蛋白质相互作用位点预测方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)