当前位置: 主页 > 神经科学 > 学习与记忆

雌激素如何塑造决策:通过多巴胺重摄取调控奖励预测误差以增强强化学习

2026-04-19 20:48 未知 未知 阅读 0
核心摘要: 2025年《自然-神经科学》研究首次揭示雌激素波动通过调控多巴胺转运体表达影响奖励预测误差信号,从而增强强化学习。雌性大鼠在动情前期17β-雌二醇升高时,伏隔核多巴胺回收减慢,RPE信号放大,决策更依赖近期奖励。该发现为理解女性认知周期性波动及精神疾病性别差异提供新机制。

2025年11月11日,《自然-神经科学》发表的一项研究,首次在活体动物中揭示了雌激素波动如何通过影响多巴胺信号来精细调节决策行为。研究发现,当雌性大鼠体内17β-雌二醇水平升高时,伏隔核中多巴胺转运体(DAT)的表达会下降,导致多巴胺回收减慢,从而使奖励预测误差(RPE)信号增强,最终使大鼠对近期奖励更为敏感,决策更为“精明”。这一发现为理解女性情绪和认知症状随生理周期波动的神经机制提供了全新视角。

雌激素不仅是生殖激素,它在大脑中广泛存在,并深刻影响着认知和情绪。然而,内源性雌激素的周期性波动如何实时塑造我们的学习与决策过程,其背后的神经计算机制始终是未解之谜。传统的强化学习理论认为,大脑通过多巴胺神经元编码的“奖励预测误差”(RPE)——即实际奖励与预期奖励之差——来不断更新我们对环境的价值判断,从而指导行为。那么,雌激素是否通过调节这一核心的学习信号来影响认知?

来自美国纽约大学的研究团队,通过精巧的行为学范式、光纤记录、光遗传学、蛋白质组学及基因敲减技术,在大鼠模型中系统地解开了这一谜题。

雌激素水平越高,大鼠对奖励越“敏感”

研究者训练大鼠执行一项“时间下注任务”,大鼠需在听到不同音调(预示不同水量奖励)后,决定是否等待奖励。研究者通过改变试次区块的平均奖励大小(高奖励区块 vs. 低奖励区块),来操纵大鼠对环境的“价值预期”。大鼠启动新试次的快慢,直接反映了其对当前环境价值预期的判断。

通过连续监测雌性大鼠的动情周期,研究者发现:在17β-雌二醇水平最高的动情前期,大鼠的行为对奖励区块的敏感性显著增强。具体表现为,当从低奖励区块切换到高奖励区块时,它们启动试次的速度加快得更明显。进一步分析显示,在动情前期,大鼠的行为更强烈地受到最近一次试次奖励结果的影响,即它们更“重视”刚获得的奖励信息来更新决策。这种学习能力的增强,与血清中17β-雌二醇的实际浓度呈显著正相关。

雌激素增强伏隔核多巴胺的RPE信号

行为层面的变化源于何处?研究者利用光纤记录技术,实时监测了伏隔核(NAcc)——一个接收中脑多巴胺投射、对动机和强化学习至关重要的脑区——中多巴胺的释放动态。

结果显示,伏隔核多巴胺信号完美地扮演了RPE的角色:听到预示奖励的音调时,多巴胺水平瞬间升高;且奖励越大,升高幅度越大;当奖励低于环境预期时,多巴胺水平甚至会下降。最为关键的是,在动情前期,这种多巴胺RPE信号的动态范围显著扩大,尤其是对预示最大奖励的音调,其诱发的多巴胺峰值更高。这表明,雌激素的升高“放大”了大脑对正性奖励惊喜的神经响应。

蛋白组学揭示核心机制:雌激素下调多巴胺转运体

雌激素如何增强多巴胺信号?研究者对伏隔核组织进行了定量蛋白质组学分析,发现了一个关键变化:在动情前期和动情期,多巴胺转运体(DAT)和血清素转运体(SERT)的蛋白表达水平显著降低。免疫组化和电镜进一步证实了DAT总量的减少,但并未观察到DAT在细胞膜上定位比例的显著改变。

DAT和SERT是负责将释放到突触间隙的多巴胺“回收”至神经元内的关键泵蛋白。它们的减少意味着多巴胺在被释放后,将在细胞外停留更长时间,清除速度变慢。计算模型模拟显示,仅仅是回收速率的减慢,就足以使连续动作电位引发的多巴胺释放产生时间叠加效应,从而导致测量到的多巴胺瞬变峰值显著增大,完美复现了实验观察到的RPE信号增强。

光遗传学证实因果链:多巴胺RPE直接驱动决策

为了确立从多巴胺信号到行为决策的因果链,研究者在任务的关键时刻(听到奖励提示音时),利用光遗传学技术人为激活大鼠伏隔核的多巴胺末梢。结果明确显示:人为添加“正性RPE信号”,足以使大鼠在随后的试次中更快地启动行为,尤其是在低奖励区块中效果更为明显。这直接证明,伏隔核多巴胺在提示音时刻的RPE信号,正是驱动行为策略更新的核心指令。

基因敲减锁定源头:中脑雌激素受体是必需枢纽

最后,研究者通过向中脑腹侧被盖区(VTA)注射shRNA病毒,特异性敲减了雌激素受体α(ERα)。结果显示,敲减ERα的大鼠,其行为对奖励区块的敏感性显著降低,降至与雄性大鼠或动情间期雌性大鼠相当的水平,且这一效应独立于雌激素对饮水动机的系统性影响。

这清晰地证明,中脑多巴胺神经元上的ERα,是雌激素调节强化学习的关键分子靶点。正是通过ERα,17β-雌二醇才能启动下游信号,最终降低伏隔核DAT的表达,从而实现对RPE信号和决策行为的精密调控。

总结与展望

这项研究首次描绘出一条完整的“内分泌-分子-神经计算-行为”通路:动情周期中17β-雌二醇升高 → 激活中脑多巴胺神经元ERα → 降低伏隔核DAT/SERT表达 → 减慢多巴胺回收 → 增强多巴胺RPE信号的动态范围 → 提升个体对近期奖励信息的利用效率(强化学习增强)

这一发现具有深远的意义:

  • 理解认知的性别差异与周期性波动:为女性在生理周期不同阶段可能经历的决策、动机和情绪变化,提供了明确的神经生物学解释。
  • 桥接计算精神病学:多巴胺和DAT/SERT功能异常是多种神经精神疾病(如精神分裂症、抑郁症、成瘾)的核心假说。本研究首次将激素调控与这些核心病理通路直接联系起来,为理解这些疾病在女性中发病率、症状表现和治疗反应的性别差异提供了全新框架。
  • 潜在的精准医疗启示:提示针对女性的精神科药物治疗,可能需要考虑其生理周期阶段,以优化疗效并减少副作用。

参考文献:
Estrogen modulates reward prediction errors and reinforcement learning Nat Neurosci 28, 2502–2514 (2025).

相关阅读:

  • Becker, J. B. & Chartoff, E. Sex differences in neural mechanisms mediating reward and addiction. Neuropsychopharmacology 44, 166–183 (2019).
  • Yoest, K. E., Cummings, J. A. & Becker, J. B. Estradiol, dopamine and motivation. Cent. Nerv. Syst. Agents Med. Chem. 14, 83–89 (2014).
    发表评论