机器学习与深度学习揭示二价组蛋白修饰的序列决定因素

2026-04-10 21:26 未知 Communications Biology 阅读 0

核心摘要： 本文介绍了一项利用机器学习和深度学习模型揭示二价组蛋白修饰序列决定因素的研究。二价修饰（H3K4me3和H3K27me3）在发育基因调控中至关重要，但其序列编码机制长期未知。研究通过分析大规模表观基因组数据，构建预测模型，识别出关键DNA序列特征和顺式元件，阐明了序列信息如何驱动修饰酶的招募。该成果为理解细胞分化中的基因调控提供了新工具，并有助于研究表观遗传相关疾病。

在发育生物学中，二价组蛋白修饰（Bivalent Histone Modifications）——即同时存在激活性的H3K4me3和抑制性的H3K27me3修饰——是维持发育基因处于“准备就绪”状态的关键机制。然而，这些修饰如何在特定的基因组位点被精确招募，其背后的序列决定因素长期以来尚不明确。

近期发表于《Communications Biology》的一项研究，通过整合机器学习与深度学习模型，系统性地破解了编码二价组蛋白修饰的序列密码。研究团队利用大规模表观基因组数据，构建了能够预测特定序列区域是否具备二价修饰潜力的计算框架。

研究结果表明，二价位点并非随机分布，而是由特定的DNA序列特征所驱动。深度学习模型识别出一系列高度保守的顺式作用元件，这些元件通过招募特定的染色质修饰酶复合体，协同调节H3K4me3与H3K27me3的沉积。通过对模型特征权重的分析，研究人员发现，GC含量、特定的基序（Motif）组合以及DNA的物理化学性质在决定二价状态中发挥了核心作用。

该研究不仅验证了序列信息在塑造表观遗传景观中的决定性地位，还通过模型解释性分析，进一步阐明了不同转录因子结合位点如何通过空间构象影响修饰酶的活性。这一成果为深入理解细胞分化过程中的基因表达调控逻辑提供了强有力的计算工具，并为研究表观遗传异常相关的疾病提供了新的理论依据。

Journal Reference: Machine and Deep Learning Reveal Sequence Determinants Encoding Bivalent Histone Modifications, Communications Biology.

TAGS: 机器学习二价组蛋白修饰序列决定因素深度学习表观遗传学

发表评论

上一篇：视频：英国推出人造胰腺有望成为贴身医生

下一篇：科学家称宇宙射线可能会导致宇航员基因突变