
伦敦大学学院(UCL)的科学家团队近日取得一项突破性进展,他们成功地利用小鼠的脑活动重建了其所观看的10秒视频,为深入理解大脑如何表征视觉信息提供了全新视角。
这项发表在著名期刊《eLife》上的研究,不仅展示了从神经信号中解码复杂视觉内容的能力,也为探索不同物种感知世界的方式开辟了新的研究途径。长期以来,科学家们对人类大脑如何解读来自眼睛的信号抱有浓厚兴趣。此前,研究人员已尝试通过功能性磁共振成像(fMRI)扫描人类大脑,并试图将视觉信息解码到像素级别。然而,这些方法在获取单个神经元层面的精细信息方面存在局限性。
此次UCL团队的工作遵循了相同的宏伟目标,但采用了更具细节性的方法:对小鼠进行单细胞记录。这种方法能够提供对大脑如何表征视觉场景更为详细的视图。研究团队仅利用小鼠视觉皮层的活动,就成功地高质量重建了小鼠观看的视频。
该研究的主要作者、UCL塞恩斯伯里惠康中心(Sainsbury Wellcome Centre)的乔尔·鲍尔(Joel Bauer)博士表示:“我们希望找到一种更好的方法来研究大脑如何解释我们所看到的一切。目前理解特定神经元群代表什么的方法,在未专门测试的情况下,通用性不强。因此,我们希望开发一种能够捕捉大脑中正在表征什么,并将其与现实进行比较的方法。”这种新方法有助于科学家们审视实际呈现内容与大脑表征之间的差异,这些差异可能揭示特定视觉线索如何影响神经表征。
鲍尔博士及其同事采用了一种动态神经编码模型,该模型最初由另一个团队为2023年Sensorium竞赛开发。该模型能够根据向小鼠展示的视频,预测单个神经元(脑细胞)的活动,同时还考虑了动物自身的运动和瞳孔直径等因素。UCL团队在同一数据集的基础上,通过比较两种情况改进了该模型:一是小鼠看到空白屏幕时预测的神经元活动,二是实际测量的神经元活动。实际活动是通过一种微观成像技术检测的,该技术能够根据局部钙水平的升高来识别哪些单个脑细胞正在放电。
这种方法使得科学家们能够从一个空白视频开始,并通过算法逐步调整其像素,直到输出视频与小鼠观看的原始视频高度匹配。模型训练完成后,研究人员仅凭小鼠的神经活动,就能够重建出一段10秒的视频。值得注意的是,这些脑活动是在小鼠观看一段未用于模型训练的视频时记录的,这证明了模型的泛化能力。
鲍尔博士补充道:“通过这种方法,我们能够实现对10秒视频片段的高质量重建。重建的准确性随着纳入更多单个神经元的数据而提高,这表明了全面神经数据的重要性。”为了衡量重建视频与原始视频的匹配程度,团队采用了像素相关性分析,比较了原始视频中每个像素与重建版本中对应像素的相似性。结果显示,两个视频在时间上的差异微乎其微。
研究人员现在计划通过收集能够支持更清晰、更广阔视觉场景重建的数据,来进一步提高重建的分辨率和视觉覆盖范围。该团队目前打算利用这项技术深入了解大脑如何处理视觉信息。他们特别希望理解为什么大脑的视觉表征会与眼前直接看到的事物有所不同。
鲍尔博士总结道:“我们头脑中并没有一个完美的世界表征。视觉处理过程会以一种修改信息的方式扭曲和变形我们的表征。这种现实与大脑表征之间的偏差不一定是错误,而是一种特征,反映了我们的大脑如何解释和增强感官信息。我们希望探索大脑中这种现象是如何发生的。”