近期发表于《Nature Communications》的一项研究,通过引入先进的深度学习架构,成功破解了内在无序蛋白(IDPs)序列特征与其液-液相分离(LLPS)能力之间的复杂关联。内在无序蛋白因其缺乏固定的三维结构,在细胞内通过相分离形成无膜细胞器,这一过程对于基因表达调控和信号转导至关重要,但其序列驱动机制长期以来难以通过传统实验手段完全阐明。
研究团队开发了一种融合了可解释性深度学习与生成式模型的计算框架。该模型首先通过大规模蛋白质序列数据训练,能够识别出驱动相分离的特定氨基酸基序(Motifs)。与传统的黑盒模型不同,该研究利用注意力机制(Attention Mechanism)精准定位了序列中对相分离贡献最大的局部区域,揭示了疏水性残基与带电荷残基的特定排列模式是诱导相分离的核心驱动力。
在验证阶段,研究人员利用该模型进行了“反向设计”实验。通过生成式算法,模型成功预测并设计出了一系列具有预设相分离倾向的合成多肽序列。实验结果显示,这些设计出的序列在体外实验中表现出了与模型预测高度一致的液滴形成能力,证明了该模型在理解序列-功能映射方面的预测精度与设计潜力。
这项研究的核心意义在于,它不仅为预测天然蛋白的相分离行为提供了高效的计算工具,还为蛋白质工程领域开辟了新路径。通过对相分离基序的精准操控,科学家未来有望开发出能够精确调控细胞内凝聚体动态的合成生物学元件,从而为治疗由相分离异常引起的神经退行性疾病提供潜在的干预策略。
Journal Reference: Interpretable and generative deep learning models explicate phase separating intrinsically disordered motifs. Nature Communications.