生物学家以实验心理学方法解析大语言模型黑箱：人工智能认知行为的新范式

2026-04-12 23:15 MIT Technology Revie MIT Technology Review 阅读 0

核心摘要： 本文介绍了跨学科团队将大语言模型视为“外星智能”，采用实验心理学和生物学方法，通过行为实验解析其黑箱机制。这一新范式不仅提升了模型可解释性，也为人工智能在生物医学等领域的应用提供了理论支撑，推动AI研究进入深度探索阶段。

随着人工智能技术的迅猛发展，大语言模型（LLM）因其庞大的参数规模和复杂的推理能力，逐渐展现出难以用传统计算机科学方法解释的“黑箱”特征。面对这一挑战，越来越多的跨学科研究人员开始借鉴生物学和实验心理学的研究范式，将大语言模型视为一种需要通过行为实验解析的“外星智能”。

这种方法的核心在于：研究者不再仅仅依赖代码分析或权重矩阵解读，而是像生物学家观察实验动物一样，通过精心设计的心理学测试，对模型的行为进行系统观测。通过认知科学的实验范式，研究人员对LLM进行受控实验，评估其在复杂任务处理中的内部表征、决策逻辑以及认知能力。

这一方法论具有高度客观性和可重复性。研究人员通过输入特定的诱导性提示（Prompt），定量分析模型在不同情境下的反应偏差、记忆能力和逻辑推理的稳健性。这类似于神经科学中通过刺激神经元来观测生物体行为，旨在通过外部行为推断模型的内部认知结构。

专家指出，随着AI系统在医疗诊断、蛋白质结构预测等生物医学领域的广泛应用，理解其决策过程的透明度变得尤为重要。将LLM视为特殊“生物体”进行科学观测，有助于识别模型潜在的幻觉和偏见，并为下一代更具可解释性的人工智能提供理论基础。这种从“工程构建”到“科学观测”的范式转变，标志着人工智能研究进入了深度探索的新阶段。

参考文献：MIT Technology Review - Meet the new biologists treating LLMs like aliens
作者：MIT Technology Review Staff

TAGS: 人工智能黑箱机制大语言模型生物学实验心理学

发表评论

上一篇：耶鲁大学教授汪小京：21世纪中国计算神经科学展望

下一篇：警惕生物安全新风险：微软研究揭示AI大模型可辅助生成“零日”生物威胁