摘要:
在破译了基因序列的后基因组时代, 随着系统生物学实验的快速发展,产生了大量的蛋白质相互作用数据,利用这些数据寻找功能模块及预测蛋白质功能在功能基因组研究中具有重要意义. 打破了传统的基于蛋白质间相似度的聚类模式,直接从蛋白质功能团的角度出发,考虑功能团间的一阶和二阶相互作用,提出了模块化聚类方法 (MCM),对实验数据进行聚类分析,来预测模块内未知蛋白质的功能. 通过超几何分布P值法和增、删、改相互作用的方法对聚类结果进行预测能力分析和稳定性分析. 结果表明,模块化聚类方法具有较高的预测准确度和覆盖率,有很好的容错性和稳定性. 此外,模块化聚类分析得到了一些具有高预测准确度的未知蛋白质的预测结果,将会对生物实验有指导意义,其算法对其他具有相似结构的网络也具有普遍意义. 关键词:蛋白质相互作用网络,蛋白质功能预测,聚类 作者 单位 卢宏超 中国科学院生物物理研究所,北京 100101;中国科学院计算技术研究所,北京 100080;中国科学院研究生院,北京 100049 石秋艳 广西师范大学物理与信息工程学院,桂林 541004 石宝晨 中国科学院生物物理研究所,北京 100101;中国科学院研究生院,北京 100049 张治华 中国科学院生物物理研究所,北京 100101;中国科学院研究生院,北京 100049 赵 屹 中国科学院计算技术研究所,北京 100080 唐素勤 广西师范大学物理与信息工程学院,桂林 541004 熊 磊 广西师范大学物理与信息工程学院,桂林 541004 王 强 广西师范大学物理与信息工程学院,桂林 541004 陈润生 中国科学院生物物理研究所,北京 100101;中国科学院计算技术研究所,北京 100080 全文见附件1 (责任编辑:泉水) |