长读长全基因组测序(LR-WGS)作为一项突破性技术,正逐步从研究工具迈向临床诊断,有望显著提升罕见病的诊断率。2025年5月7日,卡罗林斯卡学院的Jesper Eisfeldt、Marlene Ek、Magnus Nordenskjöld和Anna Lindstrand在《自然-遗传学》上发表前瞻性文章,系统阐述了LR-WGS整合到常规临床诊断中的关键挑战与潜在收益,为临床基因组学界指明了标准化道路。
核心内容:长读长测序的临床优势与挑战
该综述的核心价值在于系统阐述了长读长测序相较于当前标准方法的独特优势,并提出了临床转化的具体路线图。
1. 现有短读长测序的局限性
尽管短读长测序在单核苷酸变异和小片段插入缺失检测方面表现出色,但其存在固有局限:
- 读长过短(通常100-300 bp):难以跨越重复区域、高GC含量区域或高度同源的序列区域。
- 无法检测复杂结构变异:对于大片段插入、缺失、倒位、易位等结构变异,短读长测序的检测灵敏度和准确度较低,这些结构变异正是许多罕见病的致病原因。
- 难以定相:无法确定两个变异的顺反式关系,这对于隐性遗传病的诊断至关重要。
- 无法检测重复扩增:短读长测序无法准确测定超过读长的串联重复序列的扩增倍数,而重复扩增疾病是一大类神经遗传病的重要原因。
- 无法直接检测DNA甲基化:甲基化异常是印记疾病的分子基础,但短读长测序需要额外的实验步骤才能间接检测。
2. 长读长测序的临床优势
长读长测序(包括PacBio HiFi和Oxford Nanopore Technologies平台)能够直接克服上述局限性:
| 优势类别 | 具体描述 | 临床意义 |
|---|---|---|
| 检测复杂结构变异 | 长读长能够跨越整个结构变异断点,清晰解析插入、缺失、倒位、重复、易位等事件,甚至能发现短读长测序遗漏的隐匿性复杂重排。 | 提高诊断率,特别是在发育迟缓、多发畸形等可能由结构变异驱动的疾病中。 |
| 解析重复扩增 | 能够精确测定短串联重复和可变数目串联重复的扩增次数,包括那些位于基因非编码区的致病性重复(如脆性X综合征的CGG重复、强直性肌营养不良的CTG重复)。 | 直接诊断重复扩增疾病,避免使用Southern blot等辅助技术。 |
| 检测非编码区变异 | 能够覆盖短读长测序难以比对的区域,包括启动子、增强子、非编码RNA基因等。例如,已成功检测到导致神经发育障碍的RNU4-2(U4 snRNA基因)变异。 | 扩展诊断范围,发现位于“基因沙漠”的致病突变。 |
| 单倍体定相 | 由于读长足够长,可以跨越多个变异位点,直接确定两个变异是否位于同一条染色体上(顺式)还是分别位于两条同源染色体上(反式)。 | 对隐性遗传病的诊断至关重要,可区分复合杂合与纯合变异。 |
| 直接检测DNA甲基化 | 纳米孔测序可直接检测DNA分子通过纳米孔时的电流变化,从而推断5-甲基胞嘧啶等修饰状态,无需亚硫酸盐处理。 | 诊断印记疾病(如Angelman综合征、Prader-Willi综合征),识别患者来源与父母来源的甲基化差异。 |
3. 临床实施的挑战与解决方案
要将长读长测序从研究工具转化为临床诊断手段,仍需解决关键挑战:
- 标准化与质量控制:需建立统一的文库制备、测序和数据分析标准,包括样本要求、测序深度、覆盖度指标、变异筛选标准等。
- 成本与通量:长读长测序的单样本成本目前仍高于短读长测序。需通过多路复用、自动化流程和商业化竞争降低成本。
- 数据分析与解读:长读长数据量巨大,且存在插入缺失错误率较高(尤其纳米孔测序原始数据)的问题。需开发专门的长读长变异检测算法和临床级注释流程,培训临床生物信息学人才。
- 参考基因组与变异数据库:人类参考基因组中仍存在大量缺口(如着丝粒、端粒等重复区域)。T2T联盟完成的完整人类参考基因组为长读长测序的比对提供了极大改善。同时,需要构建包含长读长测序特异性变异(尤其是结构变异)的人群频率数据库,以区分致病性与良性变异。
- 验证与临床效用证明:需开展大规模、前瞻性的临床验证研究,在多种罕见病队列中证明长读长测序相较于现行方法的额外诊断率和临床行动改变率(如指导治疗、产前诊断、家族筛查)。
临床整合路径图
该综述提出了一个分阶段的实施策略:
- 第一阶段:单基因病或特定基因检测:对于短读长测序难以检测的基因(如SMN1、C9orf72、FMR1),采用靶向长读长测序作为一线或补充检测。
- 第二阶段:全基因组长读长测序作为二次检测:对于短读长全基因组测序阴性但临床高度怀疑遗传病的患者(尤其是疑似结构变异、重复扩增或印记疾病),进行长读长全基因组测序。
- 第三阶段:长读长全基因组测序作为一线检测:当成本降至可接受范围且分析流程成熟后,直接对罕见病患者进行长读长全基因组测序作为初筛手段。
结论与展望
长读长测序技术正以前所未有的速度成熟,其在罕见病诊断中的潜力已不容忽视。通过克服标准化、成本、数据分析等挑战,LR-WGS有望在未来几年内成为临床遗传学的重要工具,为更多患者带来明确诊断和精准治疗的机会。