当前位置: 主页 > 神经科学 > 神经组学

机器学习与深度学习揭示二价组蛋白修饰的序列决定因素

2026-04-10 21:26 泉水 Communications Biology 阅读 0
核心摘要: 本研究利用机器学习与深度学习算法,深入解析了二价组蛋白修饰(Bivalent Histone Modifications)的序列编码机制。研究发现,组蛋白H3K4me3与H3K27me3的共存并非随机,而是由特定的DNA序列特征所调控。通过构建预测模型,研究团队识别出了关键的顺式作用元件,揭示了表观遗传景观如何通过基因组序列进行编码,为理解发育过程中基因表达的精准调控提供了全新的计算生物学视角。

在发育生物学中,二价组蛋白修饰(Bivalent Histone Modifications)——即同时存在激活性的H3K4me3和抑制性的H3K27me3修饰——是维持发育基因处于“准备就绪”状态的关键机制。然而,这些修饰如何在特定的基因组位点被精确招募,其背后的序列决定因素长期以来尚不明确。

近期发表于《Communications Biology》的一项研究,通过整合机器学习与深度学习模型,系统性地破解了编码二价组蛋白修饰的序列密码。研究团队利用大规模表观基因组数据,构建了能够预测特定序列区域是否具备二价修饰潜力的计算框架。

研究结果表明,二价位点并非随机分布,而是由特定的DNA序列特征所驱动。深度学习模型识别出一系列高度保守的顺式作用元件,这些元件通过招募特定的染色质修饰酶复合体,协同调节H3K4me3与H3K27me3的沉积。通过对模型特征权重的分析,研究人员发现,GC含量、特定的基序(Motif)组合以及DNA的物理化学性质在决定二价状态中发挥了核心作用。

该研究不仅验证了序列信息在塑造表观遗传景观中的决定性地位,还通过模型解释性分析,进一步阐明了不同转录因子结合位点如何通过空间构象影响修饰酶的活性。这一成果为深入理解细胞分化过程中的基因表达调控逻辑提供了强有力的计算工具,并为研究表观遗传异常相关的疾病提供了新的理论依据。


Journal Reference: Machine and Deep Learning Reveal Sequence Determinants Encoding Bivalent Histone Modifications, Communications Biology.

    发表评论