当前位置: 主页 > 学术产业 > 会展会议

灵长类完整时间树建成:455物种演化史终明朗

2026-03-31 10:13 中国科学技术大学 阅读 0
核心摘要: 灵长目包括从400磅的大猩猩到1盎司的鼠狐猴 涵盖450余个物种 是地球上研究最深入的类群之一 然而 令人惊讶的是 直到最近 仍缺乏一份包含所有已知物种的完整分子时间树 即利用遗传数据标定物种分歧时间 关键词:DNA、气候

灵长目包括从400磅的大猩猩到1盎司的鼠狐猴,涵盖450余个物种,是地球上研究最深入的类群之一。 然而,令人惊讶的是,直到最近,仍缺乏一份包含所有已知物种的完整分子时间树——即利用遗传数据标定物种分歧时间、揭示亲缘关系的演化图谱。由天普大学、宾夕法尼亚州立大学等机构组成的团队在 Frontiers in Bioinformatics 发表研究,通过整合已发表的时间树、非时间树及公共数据库中的分子序列,构建了覆盖455种灵长类(占NCBI分类库中灵长类物种的98%) 的合成超树。这一成果不仅为灵长类演化史提供了迄今最完整的时空框架,更展示了一种可推广至其他生物类群的“从碎片到整体”的方法论,为生物多样性保护、比较生物学和演化速率研究奠定了关键基础。

时间树:演化生物学的基石

一个完整的、带有时间标度的物种演化树(timetree)具有多重科学价值:

  • 物种界定与分类:为发现隐存种、厘清分类争议提供分子谱系背景;

  • 演化速率研究:结合气候、地质历史,探究物种形成与灭绝速率的驱动因素;

  • 生物地理学:追溯物种的扩散、隔离与生物区系形成过程;

  • 保护优先级:基于演化独特性(evolutionary distinctiveness)评估物种的保护价值,指导资源分配。

然而,尽管灵长类研究历史悠久,此前最大的分子时间树仅覆盖约200种;即使是基于4000余篇文献的综合时间树(TimeTree数据库),也仅覆盖约400种,仍有约五分之一的灵长类物种缺乏明确的时间谱系位置。

数据碎片化:为什么完整时间树如此稀缺?

研究团队分析了NCBI分类库与TimeTree数据库后发现:

  • 已发表的时间树大多规模较小,平均仅包含25个物种——研究者倾向于聚焦属或科级类群,在局部获得高分辨率,但缺乏宏观整合;

  • 非时间树(未标定时间的系统发育树)在文献中远多于时间树,但它们通过少量化石校准即可转化为时间树;

  • 许多物种从未被纳入任何分子系统发育研究,但其DNA序列数据已存入GenBank等公共数据库。

这意味着构建完整时间树的“材料”广泛存在,只是分散于不同文献与数据库中,等待系统性的整合。

构建方法:三步走的超树策略

研究团队开发了一套可复现的超树(supertree)构建流程

  1. 收集已发表的时间树
    从TimeTree数据库及其他文献中提取所有涉及灵长类的时间树,保留分支长度(时间)与拓扑信息。

  2. 为非时间树添加时间标尺
    检索未标定时间的系统发育树,利用文献中的次级校准(secondary calibrations)——即从已有时间树中提取的可靠分歧时间——为这些树赋予时间尺度。

  3. 填补无树物种
    对于从未被纳入系统发育研究的物种,从GenBank下载其分子序列(如线粒体基因组或核基因片段),进行从头比对,利用已构建的时间树作为骨架进行插入,推断其最可能的分歧时间。

通过这一流程,最终成功将455种灵长类(占NCBI分类库灵长类物种数的98%)整合至单一时间树中,比TimeTree中原有的灵长类物种数增加了55种。

核心科学发现:物种形成速率与时间的博弈

利用完整时间树,研究团队检验了一个长期争论的演化问题:不同灵长类支系的物种多样性差异,究竟是由物种形成速率的差异造成,还是仅仅由支系年龄(存在时间)决定?

  • 模型比较:比较了“速率异质模型”(各支系物种形成速率不同)与“时间驱动模型”(所有支系形成速率相同,物种数随年龄积累);

  • 结果:灵长类主要支系之间的物种形成速率没有显著差异;支系年龄是物种丰富度的更好预测因子

换言之,猴、猿、狐猴等类群之所以物种数量悬殊,并非因为它们“演化得更快”,而主要是因为它们存在的时间长短不同。这一结论依赖于完整时间树对所有支系年龄与物种数的准确刻画——若缺少部分物种或年龄估计偏差,结论可能完全不同。

方法普适性:通向完整生命之树的路径

该研究的意义远超灵长类本身。团队展示了如何利用现有公开数据构建完整时间树的一般性方法,其核心优势在于:

  • 不依赖新测序:充分利用已发表的序列与系统发育树;

  • 可复现与可扩展:流程透明,可随新数据发布持续更新;

  • 跨类群适用:任何有足够分子数据与系统发育研究的生物类群均可采用。

“完整时间树是许多领域的基石资源,我们发现它们通常可以用现有数据来构建,”通讯作者Sudhir Kumar教授指出,“我们的研究方案是一种可访问且极具价值的工具,用于我们理解演化的努力。”

未来方向与挑战

尽管覆盖率达到98%,仍有少量灵长类物种因缺乏任何分子序列或系统发育数据而未能纳入。未来方向包括:

  • 对缺失物种进行靶向测序;

  • 将方法扩展至其他哺乳动物类群、鸟类、两栖爬行类及植物;

  • 整合更多基因组数据(全基因组比对)以提高分支长度估计精度;

  • 利用完整时间树研究更多宏观演化问题(如性状演化速率、灭绝风险预测)。


参考信息
Reference: “Completing a molecular timetree of primates” by Jack M. Craig, S. Blair Hedges and Sudhir Kumar, 24 October 2024, Frontiers in Bioinformatics.
DOI: 10.3389/fbinf.2024.1495417

 
    发表评论