研究背景 真菌是地球上最大、丰富度最高的生物之一,估计有150万到500万个物种,目前UNITE 数据库中有ITS序列的真菌物种为 73,929 个。 https://unite.ut.ee/ 目前具有全基因组数据的物种大约有400个,它们的基因组大小从2M-180M不等。目前真菌界的物种进化关系主要是基因树建立的,人们通常会选几个蛋白质编码基因或者DNA片段进行多序列比对,然后进行系统发育树的构建。例如2006年美国密歇根大学Tim教授用了6个基因(18S, 28S, 5.8S, EF1a 以及 RPB1 和 RPB2)对真菌高阶分类单元进行了重建。这也是目前真菌界比较稳定的系统发育树,如下图。 然而在物种进化过程中,由于其编码的每个基因收到的进化选择压力不同,比如有的非常重要的功能基因突变会导致物种死亡等,所以这类基因相对非常保守,进化速度慢,而有部分基因不编码重要的生理功能受的进化选择压力较小,从而进化速度较快。所以物种树是不能用基因树完全替代的,在以前基因组测序贵,可用数据较少的情况下用多基因树进行系统发育重建是一个很好的方向。随着真菌全基因组数据越来越多,研究者们开始尝试用不用的方法构建全基因组系统发育树如composition vector(CV) 等。 本文中,作者把两个不同的物种比喻成两本不同的书,基因树就像是用书中的一些相似的段落来判断这两本书是不是一样,而作者开发的全基因组建树的方法就是考虑从整本书的角度来全面比较两本书之间的关系,并给出更为合理的进化关系。作者开发了一种叫Feature Frequency Profile (FFP) 的方法进行全基因组树的构建。作者目标主要是a. 重新审视由基因树主导的物种进化分支关系;b.让大家争论目前用基因树进行进化模型分析的利弊并与全基因组树进行比较。 主要结果: 作者分别用已发表的全基因组数据;转录组数据以及蛋白质组数据分别建树进行比较,发现用蛋白质组数据建的树数,拓扑结构最稳定,作者用蛋白质组数据建的树分别与基因树进行了一系列比较。接下来作者给出了一些非常颠覆性的结论:
总结 本文在真菌高阶分类单元重建了现有的分类系统,虽然本文才刚刚发表还未有人引用,但可以预见本文在真菌分类进化领域的引领性作用,随着测序越来越便宜,以及生物信息学技术的发展,未来用组学数据进行进化及系统发育分析将取代基于单个或者多个基因进行系统演化方法,让大家从管中窥豹时代进入纵览全局时代。 Reference https://unite.ut.ee/ Choi J J, Kim S H. A genome Tree of Life for theFungi kingdom[J]. Proceedings of the National Academy of Sciences, 2017, 114(35):9391-9396. James T Y, Kauff F, Schoch C L, et al.Reconstructing the early evolution of Fungi using a six-gene phylogeny[J].Nature, 2006, 443(7113): 818. (责任编辑:泉水) |