基于折叠识别法的蛋白质天然构象的一致性预测法Pcons2与聚类分析的理论研究
-
摘要: 在蛋白质天然构象预测中,折叠识别法中一致性预测Pcons2和从头预测法中的Rosetta在CASP5中获得了很大的成功。在Rosetta法中,先用Monte Carlo搜索法产生大量低能量的预测模型,然后依据模型之间相似性分数,用聚类分析法选择质量好的模型。而Pcons2则是基于线性回归来预测模型的质量。人们通常认为Pcons2和聚类分析是两个完全不同的方法。本文通过理论研究和实际数据计算发现:在聚类分析中,模型之间的相似性分数与模型质量存在着较强的线性关系,这也是聚类分析的工作基础。因此,如果不考虑预测模型的来源,聚类分析和Pcons2的基本原理和算法是相同的。据此可以将Pcons2中的优势转移到聚类分析中,为从头预测最终选择较高质量的模型提供一些新途径。