本发明涉及一种蛋白质结构指纹数据库,属于生物信息学领域。包含四条表示蛋白结构指纹的字符串,由氨基酸序列,蛋白质折叠形状码,物理化学性质和向量偶合组成。所述蛋白质折叠形状码,为27个,由26英文字母加上“$”符号组成,对应27个描述五个连续氨基酸残基的折叠形状的向量;物理化学性质表示每一个氨基酸残基侧链的物理化性质,用7个字符分别表示。相邻的两个肽段共用四个氨基酸形成向量耦合。使用本发明的数据库,可以大大减少数据储存量,加快了检索速度,摆脱必须依赖超级大型计算机或者大量计算机组合资源的局面,可以实现个人电脑运作。
声明:
“蛋白质结构指纹数据库” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)