生物的基因组由A、T、G、C四种核苷酸组成。科学家发现,基因组不同区域中固定长度的核苷酸串(例如双核苷酸串有6种:AT、AG、AC、TG、TC、GC)的出现频率基本一致。最近,佐治亚大学系统生物学实验室的周丰丰博士提出,通过将基因组不同区域中所有固定长度核苷酸串的出现频率映射为不同颜色的图形,可以直观有效地展示这一特征。
该特征被称为基因组(或染色体)的“条形码”。进一步分析表明,同一物种不同染色体的条形码较为相似,而不同物种的基因组(或染色体)条形码则存在一定差异。真核生物、原核生物、叶绿体和线粒体的条形码可以清晰区分。这些特性可显著提升宏基因组学(metagenomics)的分类研究效率。此外,基因组(或染色体)条形码中可能存在一些具有不同条形码的区域,研究表明这些区域可能通过水平基因转移等机制从其他物种获得。
该成果发表于《BMC生物信息学》(BMC Bioinformatics)。(来源:生物谷)
更多阅读
周丰丰个人主页(英文)