一项发表于《自然·神经科学》的研究提出了BrainIAC——一个基于自监督学习原理的通用、多参数脑MRI基础模型。该模型在48,965个涵盖广泛人口统计学和临床环境的脑MRI数据上开发和验证,学习了鲁棒且可适应的表示。研究证明,BrainIAC在多种下游应用中优于局部监督训练和其他预训练模型,特别是在低数据、少样本设置和高难度预测任务中,使得在以前被认为不可行的场景中的应用成为可能。BrainIAC可集成到成像流程和多模态框架中,并可能促进生物标志物发现和人工智能临床转化。
研究背景与意义
应用于脑MRI的人工智能有望推动神经系统疾病的诊断、预后和治疗规划。该领域迄今受到训练数据有限和任务特定模型的限制,这些模型在患者群体和医疗任务中泛化能力不佳。通过利用自监督学习、预训练和有针对性的适应,基础模型为克服这些限制提供了一个有前景的范式。
主要发现与模型性能
研究团队开发了BrainIAC,使用对比自监督学习在涵盖十种医疗状况的16个数据集的32,015个多参数MRI上进行预训练。该模型在七个不同的临床下游任务上进行了评估,包括MRI序列分类、脑年龄预测、IDH突变检测、脑肿瘤生存预测、轻度认知障碍分类、中风时间预测和成人胶质瘤分割。BrainIAC在所有任务中一致优于基线模型,特别是在低数据(10%可用数据)和少样本(每类1或5个样本)设置中,性能差距最为显著。线性探测分析进一步证实BrainIAC学习到的特征表示质量更高,对图像伪影的鲁棒性也更强。
参考文献
Tak, D., Kann, B. H. et al. (2026). A generalizable foundation model for analysis of human brain MRI. Nature Neuroscience, 29, 945–956. DOI: 10.1038/s41593-026-02202-6
该研究开发了一个基于自监督对比学习(SimCLR)的3D Vision Transformer(ViT)基础模型(BrainIAC),用于人脑结构MRI分析。模型在近5万例多参数MRI(T1w, T2w, FLAIR, T1CE)上预训练,并在7个不同难度(从序列分类到突变预测)的下游任务中进行了系统评估。研究显示,BrainIAC在少样本(1-shot, 5-shot)和低数据场景下显著优于从头训练、MedicalNet和BrainSegFounder等基线模型,且学到的特征表示更具泛化性。研究团队来自麻省总医院布莱根等机构。