当我们学习一项新技能时,大脑必须逐个细胞地决定要改变什么。麻省理工学院皮考尔学习与记忆研究所的一项新研究表明,大脑能够以惊人的精度做到这一点——它向单个神经元发送有针对性的反馈信号,使每个神经元都能根据自己的独特输入,微调自己“倾听”的内容。这一发现颠覆了关于学习过程中大脑“教学信号”的长期假设,有望为开发更精确的神经康复手段和类脑计算提供全新框架。
一类神秘的“教学”纤维
长期以来,神经科学界普遍接受的学习模型是:突触可塑性仅由局部活动驱动。当一个突触前神经元反复与突触后神经元一起放电,它们之间的连接就会增强(赫布规则)。然而,这个模型忽略了大脑中丰富存在的、起源于脑干的脑弥漫调制系统。这些长程投射纤维向大脑皮层释放多巴胺、乙酰胆碱、去甲肾上腺素和血清素——它们不直接传递感觉信息或运动指令,而是调节着皮层神经元的整体兴奋性。
基于这一现象,MIT的研究团队提出了一个创新性假说。该假说为,在奖励学习实验中,从腹侧被盖区(多巴胺的主要来源)投射到皮层的纤维,并不是像经典理论认为的那样,在动物获得奖励时(结果阶段)释放多巴胺——而是在动物正在执行某个产生奖励的动作时会释放多巴胺,从而为皮层神经元提供一种“好,就按照你正在倾听的输入去做”的强有力的教学信号。
个体神经元特异性的学习
为验证这一假说,研究人员训练小鼠执行一个听觉趋近任务(将高音调声音与奖励配对)。在此期间,他们使用双光子钙成像和光遗传学技术,在单个树突棘的分辨率上监测和操纵腹侧被盖区轴突的活动。
他们观察到,在训练过程中,不同的VTA投射纤维与不同的树突棘发生功能连接,进而产生不同的可塑性变化。具体来说,腹侧被盖区多巴胺神经元通过释放多巴胺,为相应的目标神经元构建了一个“空间-时间”标签。这个教学信号告诉神经元:“你就是在正确的时间(动作执行时)、倾听正确信息(树突棘感受野)的神经元,因此你有资格获得增强”。
范式转变的重要意义
这项发现同样解释了负反馈机制,即“惩罚”信号也可能通过特异性的方式被传送至特定的靶标神经元。这种精确到单一细胞的教学信号,有潜力用于优化新型“闭环”脑机接口的训练过程。目前在侵入式脑机接口方面,微电极阵列无法精确记录患者每个神经元的活动,而解码算法是基于群体活动作出的预测。基于本研究发现的、可能映射到个体神经元的、高度特异性的反馈机制,未来的算法或可先筛选出那些对“向上移动”指令具有最高选择性的神经元群体,随后再将感觉反馈精准定位至该群体。
MIT的研究人员表示:“我们的大脑并非在黑箱中学习。它通过一个教学监督系统来有效地指引每个神经元的学习,而未来我们对脑机接口的设计理应利用神经元的这种精确选择性。”从基础科学的视角来看,此发现既为康复医学又为人工智能的设计指明了全新的方向。
治疗脑疾病
这项研究也为脑疾病的临床干预提供了新的视角。帕金森病患者中,向基底节投射的多巴胺能神经元死亡,这被认为损害了信号(奖励预测误差)的计算。该研究提示,向皮层投射的多巴胺能纤维(位于壳核之外)在病情早期或已受损,这可能在一定程度上解释了为什么即使服用左旋多巴后多巴胺水平已恢复正常水平,帕金森病患者的动机缺乏和学习障碍也仍然会持续存在。
2026年3月14日,《神经元》杂志刊发了上述研究。在理解大脑进行精细调控的学习机制方面,这一研究无疑开辟了新的诊疗方向,为未来的脑科学及临床转化研究奠定了坚实的基础。
来源:麻省理工学院皮考尔学习与记忆研究所,《神经元》,2026年3月14日