近日,发表在《自然-通讯》(Nature Communications)上的一项重磅研究,为人类基因组中长期被视为“暗物质”的串联重复序列(Tandem Repeats, TRs)绘制了一份详尽的图谱。串联重复序列是指基因组中由一段DNA序列重复多次组成的区域,由于其高度多态性和复杂的结构,在传统的短读长测序技术中极难被准确解析。
研究团队利用先进的长读长测序(Long-read sequencing)技术,克服了以往基因组组装中对重复区域覆盖不足的局限。通过对大规模样本的深度分析,研究者构建了一个包含数百万个TR位点的综合目录。该目录不仅涵盖了已知的微卫星序列,还精准定位了许多此前未被发现的复杂重复结构。
核心研究发现表明,这些串联重复序列在人类基因组中分布广泛,且表现出极高的遗传多样性。研究重点分析了TR序列在基因表达调控中的作用,发现许多TR位点位于启动子或内含子区域,能够通过改变染色质结构或影响转录因子结合,从而调控基因的表达水平。此外,研究还揭示了特定TR位点的扩增与多种神经退行性疾病及发育障碍之间的强关联,为理解遗传性疾病的致病机理提供了新的视角。
该研究不仅为人类基因组学研究提供了一份高质量的参考图谱,也为后续的临床遗传学诊断提供了关键数据支持。随着测序技术的进一步普及,这份串联重复图谱将成为解析复杂性状遗传基础的重要基石。
Journal Reference: Dolzhenko, E., et al. A comprehensive tandem repeat catalog of the human genome. Nature Communications.