当前位置: 主页 > 神经科学 > 神经发育与可塑性

神经群体几何学:解码大脑如何高效学习共享潜在结构的任务

2026-04-19 17:38 bioguider 千龙网 阅读 0
核心摘要: 本研究建立了神经群体活动的几何模型,揭示了大脑在处理共享潜在结构任务时的神经表征组织机制。通过分析四个几何统计量(神经-潜变量相关性、信号-信号分解性、信号-噪声分解性和神经维度),研究表明这些特征共同影响线性读出的泛化能力,并在学习过程中经历从低维压缩到高维扩展的动态演变。这一发现为理解神经编码策略及其在多任务学习中的应用提供了新的视角。

2026年2月,《自然-神经科学》发表的一项研究,通过建立神经群体活动的几何模型,首次解析了大脑在面临多个共享潜在结构的任务时,如何组织神经表征以实现最优泛化。研究发现,四个核心几何统计量——神经-潜变量相关性、信号-信号分解性、信号-噪声分解性和神经维度——共同决定了线性读出的泛化能力,且这些几何特性在学习过程中呈现出从“低维压缩”到“高维扩展”的动态演变。

人类和动物具有一种非凡的能力:识别环境中的潜在结构,并将其灵活应用于不同的情境。例如,我们既能根据“形状”区分圆形和方形,也能根据“大小”区分大圆和小圆——尽管这两类任务依赖不同的分类规则,但它们共享着“形状”和“大小”这些共同的潜在维度。大脑如何组织神经表征,以支持这种基于共享潜在结构的多任务学习?这一问题长期困扰着神经科学和人工智能领域。

来自哥伦比亚大学的研究团队,从神经群体几何学的视角切入,建立了一个优雅的理论框架。他们将每个刺激映射到一个潜在空间(如图像的形状、位置、角度),并假设神经群体对这些刺激的响应构成了一个高维表征空间。下游脑区通过简单的线性读出(如赫布型可塑性)即可完成特定的分类任务。在这一框架下,研究者推导出了泛化误差的解析公式,并将其分解为四个可直接从神经数据中计算的几何统计量。

泛化能力的四大几何支柱

根据该理论,线性读出在多个任务上的平均泛化误差,由以下四个几何项共同决定(公式1):

1. 神经-潜变量相关性(c)
这一项度量了单个神经元响应与潜在变量之间的总体相关性。它反映了神经群体对潜在空间中变化的敏感程度。相关性越高,意味着神经活动携带的“信号”越强(图2b)。

2. 信号-信号分解性(f)
这一项度量了不同潜在变量的编码方向之间的对齐程度。理想情况下,独立的潜在变量应在神经状态空间中沿不相关(最好是正交)的方向编码。分解性越高,不同任务的信号越不容易相互干扰(图2c)。

3. 信号-噪声分解性(s)
这一项度量了与潜在变量无关的神经噪声在信号方向上的投影大小。理想情况下,噪声应分布在与信号方向正交的子空间中,以最大限度地减少对任务读出的污染(图2d)。

4. 神经维度(PR(Ψ))
神经维度的参与率度量了群体活动所张成的有效维度。在其他条件相同的情况下,更高维的表征更受欢迎,因为神经噪声在不同维度上的相关性更低,更容易被平均掉(图2e)。

值得注意的是,相关性和维度的贡献随训练样本量增加而衰减——在样本稀缺的“少样本”阶段,最大化信号强度和最小化噪声影响是首要任务;而在样本充足的“多样本”阶段,保持不同任务表征的分离(高分解性)则成为主导泛化性能的关键。这一发现暗示,神经表征的几何结构可能在学习过程中发生系统性的转变。

从理论到验证:人工与生物神经网络中的几何印记

为了验证理论在非理想化数据上的适用性,研究者首先在人工神经网络中进行了测试。他们训练了一个多层感知机(MLP)来执行基于共享潜在结构的多任务分类,并逐层分析了表征的几何特征。

结果显示,理论公式准确预测了各层的经验泛化误差(图3b,c)。更有趣的是,网络的线性和非线性层在几何塑造上扮演了截然不同的角色:ReLU非线性层倾向于急剧扩展表征维度,但代价是降低了神经-潜变量相关性;而线性层则反向操作,压缩维度、提升相关性(图3d-g)。这种层间的“推挽”动态,使得泛化误差在逐层传递中整体下降,尽管单看每一层的误差变化并不剧烈。这表明,单纯观察输出层的误差可能会掩盖网络内部丰富的几何重构过程。

研究团队进一步将理论应用于两个生物神经网络数据集:

  • 猕猴视觉皮层(V4和IT):在物体识别任务中,从像素到V4再到IT,神经表征的泛化能力逐级提升。几何分解揭示,IT区最显著的特征是信号-噪声分解性(s)的急剧升高(图5e-h)——这意味着在高级视觉皮层,与任务无关的神经变异性被更有效地“隔离”在信号编码方向之外,从而保护了任务读出的鲁棒性。

  • 大鼠导航任务中的PFC和CA1:在连续交替任务的学习过程中,大鼠前额叶皮层(PFC)和海马CA1区的神经表征几何呈现清晰的阶段性变化。在学习早期(前4个session),神经-潜变量相关性迅速上升,同时总体神经维度下降——研究者通过广义线性模型分析发现,这一维度下降源于与导航无关活动的压缩,而任务相关子空间的维度实际在单调增加(图7g,h)。在学习后期(后4个session),当行为表现和读出误差趋于稳定后,几何趋势发生反转:总体维度开始回升,相关性逐渐回落,同时信号-信号分解性(f)持续提升(图7e-k)。

这些后期趋势与研究者的理论预测高度吻合:随着学习深入,最优神经表征应逐渐从“低维压缩”模式切换到“高维扩展”模式,将更多的表征容量分配给那些最初被忽视的、方差较小的潜在变量(图6c-e)。这反映出大脑从“利用有限样本快速捕捉主要信号”向“精细化分离所有潜在因子以支持灵活泛化”的策略转变。

从几何到功能:理解神经计算的通用语言

这项研究提供了一个强大的概念框架和一套可操作的量化工具,将抽象的“泛化能力”与可测量的神经群体几何特征直接挂钩。其意义不仅在于解释了大脑如何高效学习共享结构的任务,更在于为分析海量神经群体记录数据提供了一种介于单神经元调谐和整体行为之间的“介观”描述语言。

通过几何统计量,研究者可以:

  • 比较不同脑区在信息处理中的分工(如V4与IT在分解性上的差异)。

  • 追踪学习过程中神经表征的动态重组(如PFC中相关性与维度的时序变化)。

  • 诊断神经编码策略的优劣(如是否实现了信号与噪声的正交化)。

对于脑机接口和人工智能领域,该理论的启示同样深远。它暗示,设计具有良好泛化能力的神经网络,不应仅仅追求最终的输出误差最小化,还应关注隐层表征的几何特性——特别是促进信号分解性和维持适当的维度扩展。未来,通过操控神经群体的几何结构(例如通过神经反馈训练),或许能直接增强大脑的学习与泛化能力。

当然,理论目前基于线性读出的假设,而大脑中的实际读出机制可能更为复杂。将这一框架推广到非线性解码、引入更丰富的行为任务,并探索其与尖峰时序编码等精细时间结构的关系,将是未来研究的重要方向。

参考文献:
Wakhloo, A. J. et al. Neural population geometry and optimal coding of tasks with shared latent structure. Nat Neurosci 29, 682–692 (2026).

相关阅读:

  • Bernardi, S. et al. The geometry of abstraction in the hippocampus and prefrontal cortex. Cell 183, 954–967 (2020).

  • Chung, S. & Abbott, L. Neural population geometry: an approach for understanding biological and artificial neural networks. Curr. Opin. Neurobiol. 70, 137–144 (2021).

    发表评论