在发育生物学中,二价组蛋白修饰(Bivalent Histone Modifications)——即同时存在激活性的H3K4me3和抑制性的H3K27me3修饰——是维持发育基因处于“准备就绪”状态的关键机制。然而,这些修饰如何在特定的基因组位点被精确招募,其背后的序列决定因素长期以来尚不明确。
近期发表于《Communications Biology》的一项研究,通过整合机器学习与深度学习模型,系统性地破解了编码二价组蛋白修饰的序列密码。研究团队利用大规模表观基因组数据,构建了能够预测特定序列区域是否具备二价修饰潜力的计算框架。
研究结果表明,二价位点并非随机分布,而是由特定的DNA序列特征所驱动。深度学习模型识别出一系列高度保守的顺式作用元件,这些元件通过招募特定的染色质修饰酶复合体,协同调节H3K4me3与H3K27me3的沉积。通过对模型特征权重的分析,研究人员发现,GC含量、特定的基序(Motif)组合以及DNA的物理化学性质在决定二价状态中发挥了核心作用。
该研究不仅验证了序列信息在塑造表观遗传景观中的决定性地位,还通过模型解释性分析,进一步阐明了不同转录因子结合位点如何通过空间构象影响修饰酶的活性。这一成果为深入理解细胞分化过程中的基因表达调控逻辑提供了强有力的计算工具,并为研究表观遗传异常相关的疾病提供了新的理论依据。
Journal Reference: Machine and Deep Learning Reveal Sequence Determinants Encoding Bivalent Histone Modifications, Communications Biology.