蛋白质-蛋白质相互作用(Protein-Protein Interactions, PPI)是生命活动的核心,几乎参与了细胞内所有的生物学过程。然而,准确预测蛋白质复合物的结构及其相互作用界面,长期以来一直是结构生物学与计算生物学的重大挑战。近日,发表于《Communications Biology》的一项研究提出了一种基于物理信息几何不变学习(Physics-Informed Geometric Invariant Learning)的新型建模框架,为解决这一难题提供了创新路径。
研究团队指出,传统的深度学习模型在处理蛋白质结构时,往往过度依赖大规模的同源序列比对或已知的结构数据库,而在面对罕见蛋白或新型突变时,预测能力显著下降。该研究引入的几何不变学习方法,通过构建对旋转和平移具有不变性的几何特征表示,使得模型能够直接从蛋白质的三维坐标中提取核心结构信息,而无需依赖复杂的坐标系变换。
该模型的核心创新在于将物理学先验知识嵌入到神经网络架构中。研究人员将分子力场中的能量函数(如范德华力、静电相互作用等)作为约束条件,强制模型在预测过程中遵循物理定律。这种“物理驱动”的策略有效限制了搜索空间,显著降低了模型产生非生理性构象的概率。实验数据表明,该模型在处理蛋白质对接任务时,不仅在准确率上优于现有的主流几何深度学习模型,且在计算效率上实现了数量级的提升。
此外,该研究通过对多种已知蛋白质复合物的基准测试,验证了其在处理柔性蛋白质对接时的鲁棒性。通过引入多尺度几何特征融合机制,模型能够捕捉从原子级相互作用到结构域级空间排布的跨尺度信息,从而更精准地识别蛋白质结合界面。这一成果不仅为理解蛋白质功能提供了理论支撑,也为基于结构的药物设计(SBDD)提供了更高效的筛选工具,特别是在针对难成药靶点的先导化合物发现中展现出巨大潜力。
Journal Reference: Accurate protein-protein interactions modeling through physics-informed geometric invariant learning, Communications Biology.