在单细胞转录组测序(scRNA-seq)技术飞速发展的背景下,如何跨物种整合异质性数据已成为解析进化机制与疾病模型的关键挑战。近期发表于《Nature Communications》的一项研究提出了一种名为CAMEX(Cross-species Alignment and Mapping of scRNA-seq data)的新型计算框架,旨在解决多物种数据在整合、对齐与注释过程中的复杂技术难题。
研究人员指出,传统的单细胞数据整合方法往往难以有效消除跨物种间显著的生物学差异,导致细胞类型的错误匹配。CAMEX通过引入深度学习架构,能够捕捉不同物种间同源基因的表达模式,从而实现跨物种细胞状态的精准映射。该算法不仅能够有效去除实验批次效应,还能够在保留物种特异性生物学特征的同时,识别出保守的细胞类型。
在实验验证阶段,研究团队利用来自不同哺乳动物物种的scRNA-seq数据集对CAMEX进行了测试。结果显示,CAMEX在跨物种细胞对齐的准确率上显著优于现有的主流算法,尤其是在处理具有高度进化差异的组织样本时,其表现出极强的鲁棒性。此外,CAMEX还支持将高质量的参考图谱(Reference Atlas)自动迁移至目标物种,极大地降低了缺乏先验知识物种的注释难度。
这一研究成果为进化生物学研究提供了新的视角,使科学家能够更深入地探索细胞类型在数百万年演化过程中的保守性与分化规律。同时,CAMEX在医学研究领域同样具有广阔的应用前景,例如通过跨物种分析,将小鼠模型中的疾病相关细胞状态映射至人类,从而加速药物研发与临床转化进程。
Journal Reference: Yuanhua Huang, et al. Multi-species integration, alignment and annotation of single-cell RNA-seq data with CAMEX. Nature Communications (2026).