2025年12月,《自然-神经科学》发表的一项研究,首次在人原代星形胶质细胞中运用CRISPR干扰(CRISPRi)技术,系统性筛选了近千个远端候选增强子,成功鉴定出超过150个调控相互作用,并构建了一个名为AstroREG的增强子-基因调控图谱。研究发现,这些增强子控制着关键的星形胶质细胞功能,并靶向多个在阿尔茨海默病中表达异常的基因。
星形胶质细胞是人脑中最丰富的胶质细胞类型,它们在调节神经元功能、维持突触可塑性和支持脑内环境稳定中扮演着不可或缺的角色。然而,在神经退行性疾病,尤其是阿尔茨海默病(AD)中,星形胶质细胞的功能会发生显著失调。理解其基因表达如何被精细调控,是解开疾病机制的关键。
全基因组关联研究(GWAS)发现,绝大多数与复杂疾病相关的遗传变异位于基因组的非编码区,特别是远端增强子中。这些增强子像“分子开关”,能在特定细胞类型中远程激活或抑制目标基因的表达。尽管候选增强子已被广泛预测,但它们在特定细胞类型中的实际功能状态和确切的靶基因,在很大程度上仍是未知的。
来自澳大利亚新南威尔士大学的研究团队,通过将CRISPR干扰(CRISPRi)筛选与单细胞RNA测序及机器学习相结合,在人原代星形胶质细胞中绘制了首张高精度的功能增强子图谱。
功能性筛选:从千余候选者中锁定158个调控对
研究者首先利用人胎脑来源的正常人星形胶质细胞(NHA),结合ATAC-seq(染色质可及性)数据和拓扑关联结构域(TAD)信息,精心挑选了979个位于基因间区、且在星形胶质细胞中处于开放状态的候选增强子(图1)。这些区域富集了远端增强子的特征,且大部分在胎儿和成人来源的星形胶质细胞中均保持可及性。
随后,他们设计了一个包含超过2400条sgRNA的文库,通过慢病毒导入稳定表达dCas9-KRAB融合蛋白的NHA细胞中,以低感染复数(MOI=5)进行CRISPRi筛选。一周后,对近5万个高质量单细胞进行了RNA测序(图1c)。通过将携带特定sgRNA的细胞与未携带该sgRNA的细胞进行比较,研究者使用SCEPTRE算法评估了每个增强子对其上下游500kb范围内所有表达基因的影响。
筛选结果清晰地描绘了星形胶质细胞中的调控版图(图2a,b):
- 158个增强子-基因调控对(EGPs)被鉴定出来,涉及145个功能增强子和116个靶基因,其中84.1%的相互作用导致基因表达下调。
- 大多数增强子(约四分之三)仅调控一个基因,且76%的调控相互作用发生在200kb的线性距离内(图3a)。
- 出乎意料的是,虽然增强子更倾向于调控最近的基因,但仅有38.6%的EGPs靶向最近的基因。近三分之一的增强子跳过了至少一个高表达基因,转而调控更远端的靶点(图3b)。这一发现有力地挑战了“增强子主要调控最近基因”的惯常假设,强调了在非编码变异注释中直接进行功能验证的必要性。
通过独立的NanoString技术和另一细胞系的qRT-PCR验证,功能性EGPs的验证率高达90%,且两种方法测量的效应大小高度相关(r=0.86),证实了筛选结果的可靠性(图2d)。
星形胶质细胞特异性调控网络的构建
通过对功能性增强子的深入分析,研究者揭示了一系列关键特征(图3):
- 与转录紧密偶联:73%的功能性增强子可被转录为增强子RNA(eRNA),且多为双向转录,转录水平也更高。
- 染色质状态的动态性:利用跨发育阶段和跨细胞类型的单核ATAC-seq数据,研究者发现许多功能增强子的染色质状态具有细胞类型或发育阶段特异性(图3g),其中一部分属于星形胶质细胞特异的共可及性模块。
被增强子调控的基因显著富集于“趋化性”、“细胞迁移”、“创伤反应”等与星形胶质细胞核心功能相关的通路(图4a)。通过整合转录因子足迹分析和单细胞多组学数据,研究者构建了一个星形胶质细胞特异的远端调控网络(图4e)。该网络包含了18个受星形胶质细胞特异性增强子调控的基因,以及36个可能结合于这些增强子的星形胶质细胞特异性转录因子(TFs),其中FOS、JUN、SOX9等关键TFs的预测结合得到了已有ChIP-seq数据的支持。
精准定位调控AD风险基因的增强子
这项研究最引人注目的应用价值,在于其对阿尔茨海默病相关基因调控的揭示。研究者发现,被鉴定出的增强子-基因调控网络在AD相关基因集中显著富集(图5a)。通过与大规模AD队列(ROSMAP)的单核RNA-seq数据交叉比对,他们发现100个调控对涉及了在AD中表达异常、或与AD神经病理及认知评分相关的基因(图5b)。
其中,LGALS3(编码Galectin-3)是一个典型案例。Galectin-3是星形胶质细胞与小胶质细胞通讯的关键介质,并参与APOE4风险基因的病理效应。研究者鉴定出三个调控LGALS3的远端增强子,其中两个在星形胶质细胞中呈现特异性开放状态(图4d、图5b,c)。这为未来开发针对特定细胞类型的基因表达调控策略,例如通过ASO(反义寡核苷酸)或CRISPRa(CRISPR激活)上调或下调LGALS3,提供了精确的潜在靶点。
此外,该研究还发现,现有的大脑表达数量性状位点(eQTL)数据库仅能捕获约17%的CRISPRi鉴定调控对(图6b),凸显了直接进行细胞类型特异性功能筛选在注释非编码变异方面的巨大价值。
从实验到预测:训练机器学习模型扩展调控图谱
基于CRISPRi筛选产生的宝贵“金标准”数据,研究者训练了一个名为EGrf的随机森林模型,用于预测全基因组的增强子-基因调控关系。该模型整合了染色质状态、基因稳定性、距离等七个特征,在星形胶质细胞中的预测精度优于现有的基于K562癌细胞系训练的模型(图7a,b)。
应用EGrf模型,研究者在高精度阈值下(80%)预测了1,348个新的调控相互作用,涉及1,223个增强子和805个基因,极大地扩展了星形胶质细胞的潜在调控网络。其中,包含CLU(Clusterin,晚发型AD最强风险基因之一)在内的五个预测靶点,通过独立的CRISPRi实验得到了初步验证(图7d)。
总结与展望
这项研究通过系统性功能筛选,为星形胶质细胞这一关键脑细胞类型建立了首个高置信度的增强子-基因调控资源——AstroREG。它不仅揭示了星形胶质细胞基因调控的基本逻辑,更重要的是,它将大量与AD等脑疾病相关的非编码变异与特定的细胞类型、靶基因及调控回路联系起来。
这项工作也清晰地表明,通用的预测模型(尤其是基于癌细胞系训练的模型)在应用于特定原代细胞类型时存在局限,强调了开展细胞类型特异性功能基因组学研究的必要性。AstroREG资源为神经科学界提供了一个强大的工具,可用于:
- 优先排序GWAS发现的非编码风险变异。
- 设计细胞类型特异性的基因表达调控实验。
- 理解星形胶质细胞在发育、衰老和疾病过程中的动态调控机制。
未来的研究可进一步探索这些增强子在星形胶质细胞不同功能状态(如反应性状态)下的作用,并结合基因编辑技术验证关键变异的功能后果。这项研究无疑为深入理解大脑功能和攻克神经退行性疾病开辟了新的路径。
参考文献:
CRISPRi screening in cultured human astrocytes uncovers distal enhancers controlling genes dysregulated in Alzheimer’s disease. Nat Neurosci 29, 703–716 (2026).
相关阅读:
- Nott, A. et al. Brain cell type–specific enhancer–promoter interactome maps and disease-risk association. Science 366, 1134–1139 (2019).
- Fulco, C. P. et al. Activity-by-contact model of enhancer–promoter regulation from thousands of CRISPR perturbations. Nat. Genet. 51, 1664–1669 (2019).
- Leng, K. et al. CRISPRi screens in human astrocytes elucidate regulators of APOE and complement pathways. Cell Genom. 2, 100162 (2022).