当前位置: 主页 > 神经科学 > 遗传与演化

基因组污染警示:水平基因转移推断中的“假阳性”陷阱

2026-04-11 17:19 泉水 Nature Communications 阅读 0
核心摘要: 《Nature Communications》最新研究指出,基因组测序数据中的外源污染是导致水平基因转移(HGT)事件被高估的关键因素。研究团队通过系统性分析发现,许多被归类为HGT的基因片段实际上源于实验过程中的样本污染,而非生物进化过程中的遗传物质交换。该研究强调了在生物信息学分析中建立严格质量控制标准的重要性,以确保进化生物学推断的准确性。

在现代进化生物学研究中,水平基因转移(Horizontal Gene Transfer, HGT)被认为是塑造微生物基因组多样性和环境适应性的核心机制。然而,近期发表于《Nature Communications》的一项研究对当前HGT推断的可靠性提出了严峻挑战。研究人员发现,基因组测序数据中的外源污染极易被误判为HGT事件,从而导致相关进化推断的显著高估。

研究团队通过对大规模公共数据库的深度挖掘与比对分析,揭示了测序流程中常见的污染源(如实验室环境微生物、试剂污染等)如何模拟出HGT的特征信号。在生物信息学分析中,这些污染片段往往因其与目标物种的序列差异性,被算法错误地识别为近期从其他物种获得的遗传物质。这种“假阳性”不仅扭曲了对物种进化史的理解,还可能误导关于抗生素耐药性传播等关键医学问题的研究结论。

为了解决这一问题,研究人员提出了一套改进的生物信息学过滤流程。该流程强调在分析初期即引入严格的污染筛查阈值,并建议对疑似HGT事件进行更深度的系统发育树拓扑结构验证。研究指出,仅依赖序列相似性比对(BLAST)往往不足以区分真实的进化事件与人为污染。因此,建立多维度的验证标准,结合宏基因组数据分析与严格的实验对照,是提升基因组学研究质量的必由之路。

这项研究为基因组学界敲响了警钟,提醒科研人员在处理高通量测序数据时,必须对数据来源的纯净度保持高度审慎。通过优化计算模型与实验设计,科学界有望从海量数据中剥离污染噪声,从而更精准地解析生命进化的复杂图景。


Journal Reference: Genome contamination may lead to an overestimation of horizontal gene transfer inferences. Nature Communications.

    发表评论