随着人工智能技术的迅猛发展,大语言模型(LLM)因其庞大的参数规模和复杂的推理能力,逐渐展现出难以用传统计算机科学方法解释的“黑箱”特征。面对这一挑战,越来越多的跨学科研究人员开始借鉴生物学和实验心理学的研究范式,将大语言模型视为一种需要通过行为实验解析的“外星智能”。
这种方法的核心在于:研究者不再仅仅依赖代码分析或权重矩阵解读,而是像生物学家观察实验动物一样,通过精心设计的心理学测试,对模型的行为进行系统观测。通过认知科学的实验范式,研究人员对LLM进行受控实验,评估其在复杂任务处理中的内部表征、决策逻辑以及认知能力。
这一方法论具有高度客观性和可重复性。研究人员通过输入特定的诱导性提示(Prompt),定量分析模型在不同情境下的反应偏差、记忆能力和逻辑推理的稳健性。这类似于神经科学中通过刺激神经元来观测生物体行为,旨在通过外部行为推断模型的内部认知结构。
专家指出,随着AI系统在医疗诊断、蛋白质结构预测等生物医学领域的广泛应用,理解其决策过程的透明度变得尤为重要。将LLM视为特殊“生物体”进行科学观测,有助于识别模型潜在的幻觉和偏见,并为下一代更具可解释性的人工智能提供理论基础。这种从“工程构建”到“科学观测”的范式转变,标志着人工智能研究进入了深度探索的新阶段。
参考文献:MIT Technology Review - Meet the new biologists treating LLMs like aliens
作者:MIT Technology Review Staff