观察一只老鼠日复一日地闯入你的食品储藏室,你会看到一堂关于自主行为的大师课,远远超出我们最先进的机器人的能力。在神经科学中,我们常常认为这种能动性是理所当然的。毕竟,能动性——自主地、长时间地追求目标的能力——是动物行为的定义特征。即使是最简单的动物也表现出有目的的行为。然而,我们仍然不知道如何构建一个能够打扫房屋或运行实验室的自主人工智能系统。当我们试图构建能够在现实世界中长时间独立行动、根据需要调整目标的人工智能体时,我们发现能动性远比它看起来复杂。这类似于几十年前关于视觉的启示。本文系统解析能动性的复杂性、Moravec悖论、视觉处理的教训以及NeuroAI的良性循环。
一、视觉处理的教训
| 时代 | 方法 | 结果 |
|---|---|---|
| 1960年代 | Hubel和Wiesel揭示视觉处理是分层组织的(简单细胞→复杂细胞→祖母细胞) | 启发了计算机视觉研究,专注于各个子任务 |
| 早期计算机视觉 | 修补孤立的“巧妙技巧”(边缘检测、阴影形状、运动流估计) | 进展缓慢,解决方案脆弱,无法扩展或泛化 |
| 最终 | 使用人工智能成功构建计算机视觉系统 | 但我们在多大程度上理解了视觉处理仍有争议 |
Feynman名言:“我不能创造的,我就不理解。”这在机器视觉中尤为真实。
二、Moravec悖论
| 方面 | 描述 |
|---|---|
| 容易 | 让计算机在智力测试或下棋上表现出成人水平的表现 |
| 困难/不可能 | 赋予它们1岁孩子的感知和移动技能 |
| 例子 | 我们认为“难”的(国际象棋、抽象推理、复杂符号任务)对计算机相对容易;我们认为“容易”的(解析视觉场景、爬树、追踪猎物)在机器中复制则困难得多 |
| 能动性 | 是终极的Moravec挑战;我们认为是理所当然的,因为动物(包括我们)在数亿年的进化中变得如此 adept |
三、能动性的复杂性
| 方面 | 描述 |
|---|---|
| 不仅仅是识别模块 | 视觉不仅仅是特征检测器的层次结构;理解能动性的最大挑战可能不是识别涉及的各个模块,而是理解多个竞争的目标函数如何协同工作以产生行为 |
| 动物是唯一的成功例子 | 动物是唯一已知的成功自主动例子 |
四、NeuroAI的良性循环
| 方向 | 贡献 |
|---|---|
| 人工智能 → 神经科学 | 构建人工体的尝试揭示了我们对生物能动性理解的空白,为神经科学提供新的问题和假设 |
| 神经科学 → 人工智能 | 对动物的洞察可以指导开发能够有效导航复杂、开放环境的人工系统 |
五、当前挑战
| 方面 | 描述 |
|---|---|
| 基于大型语言模型的代理 | 基于大型语言模型开发“代理人工智能”的热情很高(如阅读科学文献、制定假设、设计实验、分析数据、更新假设) |
| 不确定性 | 这种方法的成功仍然远未确定;我们甚至不能信任基于大型语言模型的代理导航美国国立卫生研究院网站提交资助申请 |
| 不能简单组合 | 我们不能简单地将感知、规划和行动模块组合在一起,期望出现鲁棒的目标导向行为 |
六、结论:从视觉教训到能动性
研究人员曾经认为,通过拼凑巧妙的小技巧(边缘检测器、阴影形状等),我们可以构建一个完整的视觉系统。我们错了。在我们努力赋予人工智能能动性的过程中,类似的模式正在出现。如果说有什么不同的话,视觉的教训在能动性领域更为相关:有目的的行为,在动物生命之初就出现了,仍然是所有动物最根本和定义性的特征。认识到这种复杂性并拥抱神经科学的教训,可以引导我们走向更复杂、更安全的自主人工智能,同时加深我们对大脑最卓越和最基本能力的理解。
核心信息:
-
能动性:自主地、长时间地追求目标的能力(动物的定义特征)。
-
Moravec悖论:我们认为“难”的对计算机容易;我们认为“容易”的对计算机困难。
-
视觉教训:修补孤立的“巧妙技巧”失败;构建系统揭示了理解的空白。
-
NeuroAI良性循环:人工智能→神经科学(揭示空白);神经科学→人工智能(提供洞察)。
-
挑战:基于大型语言模型的代理远未确定;不能简单组合模块。