当前位置: 主页 > 神经科学 > 脑机接口

科学家质疑:AI真的能像人类一样思考吗?

2026-03-30 10:35 泉水 生物行 阅读 0
核心摘要: 一项最新研究对人工智能模拟人类认知的能力提出了严峻质疑 去年曾引发轰动的AI模型 人马座 Centaur 被指其看似理解人类思维的表现 很可能仅仅是 死记硬背 训练数据的结果 而非真正的理解 这一发现 关键词:能源、记忆

一项最新研究对人工智能模拟人类认知的能力提出了严峻质疑。去年曾引发轰动的AI模型“人马座”(Centaur)被指其看似理解人类思维的表现,很可能仅仅是“死记硬背”训练数据的结果,而非真正的理解。这一发现提醒我们,在评估AI能力时需要更加审慎。

认知模拟的“里程碑”遭遇挑战

长期以来,心理学家们一直在争论一个核心问题:人类心智(如记忆、注意力、决策)能否被一套统一的理论所解释,还是必须作为独立的系统来研究?如今,人工智能的发展为这个问题提供了新的验证途径。

2025年7月,一项发表于《自然》杂志的研究介绍了一个名为“人马座”的AI模型。该模型基于现有的大型语言模型构建,并使用心理学实验数据进行优化,旨在模仿人类的思考和决策方式。其创造者声称,“人马座”能够重现人类在160种不同认知任务中的表现,涵盖执行控制和选择行为等领域,这被广泛解读为AI接近通用认知模型的潜在突破。

“理解”还是“死记硬背”?

然而,一篇发表于《国家科学进展》的最新研究,对这一说法提出了强烈质疑。来自浙江大学的研究团队认为,“人马座”看似卓越的“人类认知模拟能力”,很可能源于过度拟合(Overfitting)。这意味着模型可能仅仅是记住了训练数据中的模式,而非真正理解了任务本身。

为了验证这一猜想,研究人员设计了几项新的实验。其中一项测试是,他们将原本描述特定心理任务的多选题提示,替换为一句简单的指令:“请选择选项A”。如果模型真正理解了任务,它理应每次都选择A。然而,“人马座”依然给出了与原数据集相同的“正确答案”。

这种行为表明,模型并没有理解问题的意图,而只是依靠统计关联来得出答案——就像一个通过识别模式拿到高分,但实际上并未掌握知识的学生。

对AI评估的启示

这项研究的发现凸显了评估大型语言模型时需要更严谨的方法。尽管这些系统在拟合数据模式方面表现出色,但其“黑箱”设计使其容易出现“幻觉”和错误解读等问题。要判断一个模型是否真正具备其看似拥有的能力,必须进行多维度、更严格的测试。

研究指出,尽管“人马座”被描述为一个“认知模拟”系统,但其最显著的弱点恰恰在于语言理解,特别是理解问题背后意图的能力。实现真正的语言理解,可能仍是开发通用认知模型过程中面临的最大挑战之一。


研究信息

Reference: “Can Centaur truly simulate human cognition? The fundamental limitation of instruction understanding” by Wei Liu and Nai Ding, 11 December 2025, National Science Open.
DOI: 10.1360/nso/20250053

    发表评论