代谢基因产物的底物识别对于理解其在生理和疾病中的功能至关重要。然而,人类基因组中仍有大量代谢相关基因(尤其是溶质载体家族的转运蛋白)的功能未被表征,被称为“孤儿转运蛋白”。传统方法依赖于低通量的生化实验,且缺乏将遗传变异与代谢物水平变化系统关联的策略。
2024年7月11日,《自然-遗传学》发表了一项研究简报,介绍Khan, A.团队开发的GeneMAP(Gene-Metabolite Association Platform)平台。GeneMAP是一种利用基因表达模型预测代谢基因功能的多组学平台。研究者通过该方法预测并实验验证了一个得分最高的基因-代谢物关联,从而揭示了SLC25A48在线粒体胆碱import中的关键作用。这项研究展示了整合基因组学和代谢组学数据进行基因功能发现的强大范式。
核心内容:GeneMAP的原理与验证
该研究的核心价值在于,它建立了一个计算-实验闭环系统,用于大规模预测和验证代谢基因的功能。
1. GeneMAP的计算框架
GeneMAP基于两个核心假设:
-
转录调控:一个代谢基因的表达水平与其活性的底物或产物的丰度之间存在相关性。
-
遗传共调控:影响该基因表达(例如,通过表达数量性状位点)的遗传变异,也应与其底物/产物的血液水平相关联。
基于这些假设,GeneMAP整合了以下数据:
-
基因表达参考面板:来自GTEx项目等,建立了基因表达与遗传变异的统计模型(即预测该基因的表达)。
-
遗传关联数据:来自代谢物全基因组关联研究(汇总统计量),其中包含数千种血液代谢物。
-
转录组全关联研究:通过计算基因的预测表达与代谢物水平之间的关联,GeneMAP可以提名“基因-代谢物”对:当某个基因的预测表达水平与某种代谢物的血液浓度显著相关时,该代谢物即为该基因的候选底物/产物。
2. 关键预测与实验验证
GeneMAP预测的最强关联之一指向SLC25A48(一个线粒体转运蛋白)与胆碱水平之间的负相关。即:SLC25A48预测表达越高,血液中胆碱浓度越低(提示SLC25A48可能促进胆碱的消耗或区室化)。
研究者对SLC25A48进行了功能验证:
-
定位:在细胞中,SLC25A48定位于线粒体内膜。
-
功能:敲除SLC25A48导致细胞中线粒体胆碱水平下降,而胞质胆碱水平升高;过表达则相反。这表明SLC25A48的功能是将胆碱从胞质转运入线粒体。
-
代谢后果:SLC25A48缺失导致线粒体胆碱缺乏,进而影响胆碱下游代谢物(如磷酸胆碱、甜菜碱)的生成,并损害线粒体呼吸功能(ATP合成减少,活性氧增加)。
-
生理关联:在人类遗传数据中,SLC25A48附近的变异与血液甜菜碱水平和心血管疾病风险相关,提示其作为潜在药物靶点的可能性。
3. 与其他方法的比较与优势
-
区别于传统全基因组关联研究:全基因组关联研究鉴定的是与代谢物相关的基因组位点,而非特定基因。GeneMAP通过转录组全关联研究直接指向效应基因,避免了在非编码区的解释困境。
-
区别于共表达网络:共表达网络基于表达相似性,无法区分“原因”和“结果”或识别底物关系。GeneMAP整合了遗传学(表达数量性状位点),提供了更强的因果推断支持。
-
与其他代谢物-基因关联方法的对比:现有的方法(如代谢物全基因组关联研究后基于位置的“猜谜”)通量低且容易出错。GeneMAP提供了一个系统性的、数据驱动的筛选平台。
意义与展望
该方法对代谢研究和精准医学具有重要价值:
-
加速孤儿转运蛋白的注释:人类SLC家族中仍有大量成员功能未知。GeneMAP可系统性地提名这些蛋白的候选底物,极大地缩小实验验证的范围。
-
发现新的药物靶点:通过将GeneMAP关联与疾病全基因组关联研究数据交叉,可将代谢基因与特定疾病(如糖尿病、神经退行性疾病、癌症)风险联系起来。例如,SLC25A48与甜菜碱水平和心血管疾病的关联提示其可能成为治疗心血管疾病的新靶点。
-
个性化营养与代谢干预:个体间SLC25A48的表达水平差异可能影响胆碱的需求量和代谢效率。GeneMAP的输出可为基于个体基因型的精准营养建议提供依据。
-
未来方向:包括扩展到更多组织特异性表达模型(当前主要基于血液),整合蛋白组学数据(蛋白质丰度比RNA更接近功能),结合脂质组学和其他代谢物类别(当前主要聚焦于水溶性代谢物),以及利用基因编辑技术验证更多高分预测结果。
参考文献
-
Khan, A. et al. (2024). Metabolic gene function discovery platform GeneMAP identifies SLC25A48 as necessary for mitochondrial choline import. Nature Genetics. https://doi.org/10.1038/s41588-024-01827-2
-
César-Razquin, A. et al. (2015). A call for systematic research on solute carriers. Cell.
-
Gamazon, E. R. et al. (2015). A gene-based association method for mapping traits using reference transcriptome data. Nat. Genet.
-
Gusev, A. et al. (2016). Integrative approaches for large-scale transcriptome-wide association studies. Nat. Genet.
-
Kenny, T. C. et al. (2023). Integrative genetic analysis identifies FLVCR1 as a plasma-membrane choline transporter in mammals. Cell. Metab.