大脑如何从复杂的自然声音中提取有意义的信息?俄勒冈健康与科学大学和罗切斯特大学的研究团队利用卷积神经网络(CNN) 模型,揭示了听觉皮层中不同类型神经元在声音编码中的分工模式。该研究发表于 《自然·神经科学》,首次通过深度学习模型识别出神经元群体对声音特征进行稀疏、解离的编码——这一机制被认为是从自然刺激中识别关键特征的通用原则。
研究方法:从“编码模型”到“刺激子空间”
研究团队长期致力于开发神经编码模型——将声音信号的声谱图与听觉神经元的响应模式进行函数性关联。传统模型多为线性或浅层结构,无法捕捉非线性特征。本研究中,他们采用端到端训练的卷积神经网络(CNN),用动物在听取大量自然声音时记录的单个听觉皮层神经元活动来训练模型。
训练的CNN能够高精度预测神经元对任意新声音的响应。但深度学习的经典挑战在于可解释性:模型性能优越,但“黑箱”内部难以理解。研究团队的核心创新是:对训练好的CNN计算其输入-输出关系的多个局部线性近似(类似于用多条切线拟合一条复杂曲线),然后对这些近似进行主成分分析(PCA)。这样一来,将原本高维的声音特征空间降维为一个仅由少数几个维度构成的 “刺激子空间”(stimulus subspace) ——即真正驱动该神经元活动的、精简后的声音特征集合。
核心发现:神经元分工解码,子空间共享但选择性正交
1. 不同皮层层次及细胞亚型具有系统性编码差异
-
皮层层次:位于听觉皮层不同层次(颗粒上层、颗粒层、颗粒下层)的神经元,其刺激子空间结构存在系统性差异,反映了声音信息在不同层次间的递阶变换。
-
细胞类型:根据动作电位形态区分的规则峰细胞(推测为兴奋性锥体神经元) 与窄峰细胞(推测为抑制性中间神经元) 之间,存在显著的编码特性差异——提示兴奋-抑制平衡在自然声音处理中具有特定的子空间结构。
2. 局部神经元群体共享子空间但响应呈“稀疏且解离”模式
最关键发现:听觉皮层中位置彼此邻近的一群神经元,往往共享相同的刺激子空间(即它们都对同一组简约的声音特征敏感)。然而,在这个共享的低维子空间内,每个神经元的调谐方向高度解离(disjointed)——也就是说,它们各自响应子空间中几乎正交的不同角落。
这种组织方式的后果是:对于任何一个自然声音,它在共享子空间中投影后,只会稀疏地激活该群体中极少数的神经元(而非广泛激活),形成一种稀疏编码。这被计算神经科学界普遍认为是实现高效、抗干扰、易于解码的神经表征的理想方式,尤其有利于特征识别——从嘈杂背景中快速识别出特定声音模式(如捕食者的叫声、同伴的呼唤)。
技术突破:从“黑箱”到可解析的刺激子空间
该方法的创新性在于:利用训练后的CNN作为神经元的高精度可微替代模型,然后通过梯度计算+主成分分析,将“这个神经元对什么样的声音特征响应”这个复杂问题简化为一个低维子空间内的可视化问题。
研究团队以此构建了“子空间感受野(SSRF)”,可在2-3个主维度上直观展示神经元调谐特性。这一方法不依赖于预先选定的声音特征集合(如频率、调制速率等),而是由数据驱动,从自然声音统计特性中自动发现相关特征,因此更具生态效度。
临床与未来方向
对听觉与认知科学的意义
本研究为大脑如何从自然环境中提取行为相关信息提供了具体的神经计算机制:共享子空间 + 正交选择性的组合,可能是一种跨物种、跨感觉模态(听觉、视觉、触觉)的通用编码策略。
研究扩展
-
跨模态应用:David教授表示正在寻求合作,将子空间分析应用于其他感觉模态(如视觉、体感)。
-
状态依赖编码:其实验室正在开发多模态CNN,以整合声音处理和行为状态(如注意、唤醒、预期)的信息,探究同一神经元群体在不同内部状态下的子空间重组。
-
疾病模型:未来可结合精神分裂症、自闭症等存在声音处理异常的疾病动物模型,探索子空间结构是否及如何被病理状态改变。
理解要点
| 概念 | 解释 |
|---|---|
| 刺激子空间 | 驱动一个神经元活动的声音特征的低维集合(从高维声谱图中提取的最相关信息) |
| 共享子空间 | 局部神经元群体共同敏感的声音特征集 |
| 解离/正交选择性 | 在同一子空间内,不同神经元响应几乎互不重叠的声音方向 |
| 稀疏编码 | 对任一自然声音,群体中只有少数神经元被激活;利于能量、编码效率与特征识别 |
| CNN + PCA联合法 | 利用深度学习的预测能力 + 线性近似获得可解释的神经编码描述 |
论文信息:Wingert, J. C., et al. (2026). Convolutional neural network models describe the encoding subspace of local circuits in auditory cortex. Nature Neuroscience. DOI: 10.1038/s41593-026-02216-0
关键概念:听觉皮层 | 卷积神经网络 | 刺激子空间 | 稀疏编码 | 神经编码模型 | 兴奋-抑制平衡
相关领域:系统神经科学 | 计算神经科学 | 听觉神经科学 | 深度学习可解释性
——本文基于Medical Xpress报道及Nature Neuroscience原始论文编译,经科学编辑与独立审稿人复核,面向生物医学及神经科学专业读者