表观遗传修饰在基因调控、细胞分化和疾病发生中起着至关重要的作用。传统的短读长测序方法虽然能够以单碱基分辨率绘制DNA甲基化图谱,或通过染色质免疫沉淀测序等方法定位组蛋白修饰和转录因子结合位点,但这些方法通常只能检测单一的表观层面,并且无法在单分子水平上揭示多个表观标记之间的相位关系。
2025年1月8日,西班牙国家研究委员会综合系统生物学研究所的Tianyuan Liu和Ana Conesa在《自然-遗传学》上发表了一篇重要综述。该文系统讨论了基于长读长测序技术(由Oxford Nanopore Technologies和Pacific Biosciences提供)的表观基因组研究策略,重点介绍了LRS在直接检测DNA甲基化、同时分析染色质可及性、转录因子结合和组蛋白修饰等多维度信息方面的独特优势,并展示了如何整合多种LRS方法设计多组学研究。
核心内容:长读长测序在表观基因组学中的优势
该综述的核心价值在于,首次全面总结了LRS如何克服短读长测序在表观基因组研究中的固有局限,并绘制了整合多层面表观信息的技术路线图。
1. 直接检测DNA甲基化与碱基修饰
LRS技术的最大优势之一是无需亚硫酸盐处理(该过程会导致DNA降解且无法区分5mC和5hmC),即可直接检测碱基修饰。
-
PacBio 方法:通过检测DNA聚合酶在合成过程中的动力学变化(脉冲间隔和脉冲宽度)来识别甲基化碱基。最近开发的循环一致性测序模式可生成高精度的单分子共有序列,同时检测序列变异和甲基化状态。
-
Oxford Nanopore 方法:DNA或RNA分子通过纳米孔时产生的电流变化受碱基修饰影响。通过多种深度学习算法来解读这些信号,实现对5mC、6mA等多种修饰的单分子、单碱基检测。
-
优势:可直接获得单分子单倍型分辨率的甲基化信息,即同时知道一条DNA分子上的甲基化模式和其上的等位基因变异,这对研究等位基因特异性的表观调控至关重要。
2. 染色质状态的多维度单分子分析
LRS不仅可检测甲基化,还能通过多种新型实验方法同时评估染色质的多个层面:
| 方法类别 | 代表性技术 | 可检测信息 | 关键优势 |
|---|---|---|---|
| 染色质可及性 | Fiber-seq (基于纳米孔) | 使用GpC甲基转移酶标记开放的染色质区域,通过检测新增的甲基化信号来定位核小体缺失区。 | 单分子分辨率,可同时检测可及性、DNA甲基化和序列。 |
| 核小体占位与转录活性 | SAM-seq (基于纳米孔) | 利用抗体或DNA结合蛋白标记特定组蛋白修饰(如H3K4me3)或RNA聚合酶,通过检测蛋白结合引起的纳米孔信号变化来定位。 | 可同时检测核小体定位、转录延伸和DNA甲基化。 |
| 转录因子结合与组蛋白修饰 | BIND&MODIFY (基于纳米孔); DiMeLo-seq (基于纳米孔) | 将抗体或转录因子融合到DNA甲基转移酶上,将结合位点附近的特定碱基甲基化,通过检测甲基化信号来定位。 | 实现单分子水平的蛋白-DNA互作检测,无需免疫沉淀。 |
| 染色质三维结构 | Pore-C (基于纳米孔); Multi-contact 4C | 通过连接邻近的DNA片段并测序,捕获单分子上的多个远程互作。 | 可同时检测多向互作、DNA甲基化和序列变异。 |
LRS与短读长测序的关键区别:短读长方法(如ChIP-seq、ATAC-seq)需要破坏细胞群体并平均化数百万个细胞的信号,无法获知单个DNA分子上不同表观标记的组合模式(例如,一个特定的甲基化CpG是否与特定的组蛋白修饰出现在同一条染色单体上)。LRS则保留了单分子相位信息,可区分等位基因特异性的表观状态、父源/母源染色体的差异,以及同一分子上调控元件与靶基因的直接连接。
3. 整合转录组与表观组
LRS还能同时检测RNA分子,为理解表观调控与转录输出之间的关系提供了直接工具:
-
直接RNA测序:纳米孔技术可直接测序天然RNA分子,同时检测碱基修饰和聚腺苷酸尾长度,并识别全长转录本亚型。
-
新生RNA测序:通过分离正在转录的RNA(与RNA聚合酶结合的),LRS可绘制转录延伸的动态图谱,并将转录活性与染色质状态直接偶联(例如,将RNA聚合酶II的暂停释放与启动子近端的H3K4me3和DNA低甲基化状态相关联)。
-
同时检测DNA和RNA:新方法(如scNanoCOOL-seq)可在单个细胞内同时进行LRS,获得匹配的基因组、甲基化和转录组数据。
技术挑战与未来方向
尽管LRS在表观基因组学中展现出巨大潜力,但仍面临挑战,并为未来发展指明了方向:
-
数据准确性与标准化:纳米孔测序原始数据错误率仍较高,碱基修饰检测的准确性在不同序列上下文和不同物种之间存在差异。需要持续优化生化实验和深度学习模型。
-
通量与成本:虽然成本在快速下降,但LRS的通量仍低于短读长测序。对于需要大量样本的群体表观遗传学研究,需开发更高通量的LRS方案。
-
数据分析的复杂性:LRS数据量巨大,且包含丰富的修饰信息。需要开发用户友好的、标准化的分析流程,整合甲基化 calling、染色质状态分型和结构变异检测。
-
单细胞表观基因组学:将LRS应用于大规模单细胞表观基因组分析仍具挑战,但已有概念验证研究。未来的方向是实现高通量、低成本的单细胞、单分子表观多组学。
-
临床转化:LRS在诊断中的应用(如检测重复扩增疾病的同时评估其甲基化状态)正在增长。未来应开发可直接从少量临床样本(如活检、游离DNA)进行全表观基因组分析的方法。
参考文献
-
Liu, T. & Conesa, A. (2025). Profiling the epigenome using long-read sequencing. Nature Genetics, 57, 27–41.
-
Marx, V. (2023). Method of the year: long-read sequencing. Nat. Methods.
-
Flusberg, B. A. et al. (2010). Direct detection of DNA methylation during single-molecule, real-time sequencing. Nat. Methods.
-
Simpson, J. T. et al. (2017). Detecting DNA cytosine methylation using nanopore sequencing. Nat. Methods.
-
Lee, I. et al. (2020). Simultaneous profiling of chromatin accessibility and methylation on human cell lines with nanopore sequencing. Nat. Methods.
-