新基因的产生是进化创新的核心驱动力之一。传统观点认为,新蛋白质主要通过已有基因的复制和分化而演化。然而,在过去十年中,我们对不同生物中新基因起源机制的理解取得了实质性进展,揭示了除基因复制外还有十多种产生初始基因结构的分子机制。
2025年1月28日,芝加哥大学的Shengqian Xia、Jianhai Chen、Deanna Arsala和Manyuan Long,以及加州大学尔湾分校的J. J. Emerson在《自然-遗传学》上发表了一篇重要综述。该文系统总结了新基因起源的多种分子机制,论证了新基因通过突变和选择整合到并修饰现有基因网络的普遍规律,并强调了新基因在表型和功能进化中的重要作用,具有农业和医学转化价值。
核心内容:新基因起源的机制谱系
该综述的核心价值在于,首次将多种新基因起源机制整合在一个统一的框架下,并确认了从头起源作为与基因复制同等重要的创新来源。
1. 新基因起源的多种分子机制
从机制上,新基因的产生可分为两大类:基于已有基因物质的机制和从头起源机制。
| 机制类别 | 具体机制 | 描述 | 经典案例 |
|---|---|---|---|
| 基于已有基因 | 基因复制 | 通过不等交换、逆转录转座或全基因组复制产生额外基因拷贝,随后发生功能分化(新功能化或亚功能化)。 | 珠蛋白基因家族(氧气运输适应性进化);嗅觉受体基因家族(环境感知多样性) |
| 外显子重排 | 不同基因的外显子通过重组或转座子介导,拼接成新的嵌合基因。 | jgw基因(Drosophila,由乙醇脱氢酶和限制性内切酶基因外显子融合而成) | |
| 逆转录转座 | 信使RNA被逆转录为互补DNA并插入基因组新位置,产生无内含子的逆转录拷贝(加工假基因或功能性逆转录基因)。 | Pgk2(小鼠睾丸特异性磷酸甘油酸激酶) | |
| 移动元件捕获 | 转座子捕获相邻基因片段,通过转座将片段带到基因组新位置,形成新基因或新外显子。 | 部分水稻抗病基因(由pack-MULEs介导) | |
| 基因融合与分裂 | 两个相邻基因融合成一个转录单元,或一个基因分裂为两个独立基因。 | Sdic(Drosophila,Cct和Cdic融合) | |
| 从头起源 | 非编码序列从头起源 | 从先前非编码的DNA序列(基因间区或本来非翻译的区域)中,通过逐步突变获得转录和翻译能力,形成全新的蛋白质编码基因。 | Goddard(Drosophila,睾丸特异表达);QQS(Arabidopsis,调控淀粉代谢) |
| 替代阅读框起源 | 在现有基因的编码区内,利用不同的阅读框编码全新的蛋白质(重叠基因)。 | 部分病毒基因;Antifreeze glycoprotein(南极鱼,由胰蛋白酶原基因的替代阅读框演化而来) |
2. 新基因的命运:快速整合与功能分化
新基因产生后并非静止,而是具有高度动态的演化命运:
-
快速获得功能:许多新基因(尤其是在性腺中表达的基因)演化速率非常快,受到正向选择的驱动力。年轻基因在形成后短时间(几百万年)内即可获得重要的生物学功能,甚至成为必需基因。例如,在果蝇中,约三分之一的新基因在敲除后会导致雄性不育。
-
整合进入网络:新基因并非独自发挥作用。通过蛋白-蛋白互作和转录调控,快速整合到现有的基因调控网络中。既可以作为网络中的新节点,也可以作为旁系同源物与原有基因形成新的亚功能模块。例如,在Brassica napus中,两个年轻基因整合入调控网络,影响了开花时间和器官形态。
-
表达模式的快速特化:新基因往往在特定组织(尤其是睾丸和大脑)中表达,且表达模式在物种间分化迅速。这种特化与其在生殖和神经系统功能创新中的作用一致。
-
性冲突驱动的演化:许多新基因的起源和固定与性冲突(性拮抗选择)密切相关。位于X染色体上的基因向常染色体的逆转录转座,可以避免在XX个体中过量表达而造成的雌性损害,同时维持其在雄性中的功能。
3. 从机制到表型:新基因的广泛影响
该综述通过大量案例展示了新基因在表型多样性中的驱动作用:
-
形态与发育:人类特异的 NOTCH2NL 基因(由部分 NOTCH2 复制产生)促进大脑皮层神经发生,与人类大脑体积扩张相关;ARHGAP11B 同样是人特异基因,调节基底前体细胞增殖,影响脑回形成。
-
生理与代谢:南极鱼抗冻糖蛋白基因(从胰蛋白酶原基因的替代阅读框起源)使鱼类适应冰水环境;水稻 JAUP1 基因(从头起源)调节茉莉酸信号通路,增强根系发育和耐逆性。
-
生殖与性二态:果蝇 Sdic 基因(基因融合起源)影响精子活力;小鼠 Poldip2 基因(逆转录起源)参与精子发生;许多从头起源的果蝇基因在睾丸中特异表达,敲除后导致雄性不育。
-
免疫与抗病性:水稻 Xa7 基因(特异的孤儿基因)赋予对白叶枯病的持久广谱抗性;拟南芥中快速演化的基因簇参与病原菌识别与防卫反应。
新基因研究的范式转变与未来方向
该综述标志着一个重要的范式转变:新基因的起源不再是罕见事件,而是一个普遍的、持续发生的进化过程。以下关键点需要未来深入研究:
-
从头基因的起源机制:从非编码序列到功能性基因的完整路径是什么?哪些“前驱基因”(proto-gene)阶段是可检测的?如何区分功能性年轻基因与转录噪音?
-
新基因的结构演化:新蛋白质如何从无序或部分有序的状态演化为稳定折叠的结构?这需要结合实验结构生物学和预测方法(如AlphaFold)进行研究。
-
表型效应的分子机制:新基因如何与其他基因互作,在分子、细胞、器官和个体水平上产生表型效应?需要更多以基因为中心的高通量功能筛选。
-
进化力平衡:在新基因演化的不同阶段(起源、固定、分化),遗传漂变、正向选择和净化选择的相对贡献如何随时间变化。
-
转化应用:如何利用新基因知识改进作物性状(如抗病、高产)以及理解人类疾病?已有研究表明,某些癌症特异性基因可能源于新近起源的年轻基因,它们或可作为癌症治疗的选择性靶点。
参考文献
-
Xia, S., Chen, J., Arsala, D. et al. (2025). Functional innovation through new genes as a general evolutionary process. Nature Genetics, 57, 295–309.
-
Long, M., Betrán, E., Thornton, K. & Wang, W. (2003). The origin of new genes: glimpses from the young and old. Nat. Rev. Genet.
-
Chen, S., Zhang, Y. & Long, M. (2010). New genes in Drosophila quickly become essential. Science.
-
VanKuren, N. & Long, M. (2018). Gene duplicates resolving sexual conflict rapidly evolved essential gametogenesis functions. Nat. Ecol. Evol.
-
Vakirlis, N. et al. (2020). De novo emergence of adaptive membrane proteins from thymine-rich genomic sequences. Nat. Commun.