费曼数学解密“吃什么”：行为实验验证最优策略

已故美国物理学巨匠理查德·费曼（Richard Feynman）曾将一个看似寻常的晚餐选择难题，巧妙地转化为一道数学谜题：在一家常去的餐厅，我们究竟应该坚持点最爱的菜品，还是冒险尝试新口味？这个困扰无数食客的“探索与利用”两难困境，费曼当年在一张纸上便给出了他的数学解法。

如今，行为科学家们重新审视了费曼的这一解决方案——其中一些曾因他那难以辨认的笔迹而模糊不清——并证实他的策略确实是最优解。这项研究不仅重现了费曼的数学洞察，更通过大规模行为实验，揭示了人类在面对类似决策时的内在逻辑。

费曼的困境对任何餐厅常客来说都耳熟能详：我们是应该继续点目前为止吃过的最好吃的菜，还是应该探索菜单，希望能找到更好的？近期发表在《美国国家科学院院刊》（Proceedings of the National Academy of Sciences）上的一项研究深入探讨了这个问题，并提供了实验证据，表明参与者在选择餐点时所采用的策略，与费曼的数学解法高度近似。

耶路撒冷希伯来大学的行为科学家肖汉姆·乔森-希勒尔（Shoham Choshen-Hillel）称赞该文章“极具创意”。她补充道：“餐厅的例子代表了许多情境下的决策。”现实生活中的例子包括选择购买房屋、决定伴侣以及选择停车位等。

费曼的数学洞察：从餐厅到“停止问题”

故事始于20世纪70年代末，诺贝尔奖得主、加州理工学院物理学家费曼与他的朋友拉尔夫·莱顿（Ralph Leighton）常去格伦代尔附近的一家泰国餐厅。莱顿当时犹豫不决，是该点他最爱的姜汁鸡肉，还是探索菜单上的其他菜品。费曼随即开始涂写计算，并声称他找到了一个数学解决方案：在他简化的模型中，他计算出了一个阈值——一个在超过该次数的访问后，莱顿的理性决策将是始终选择他最喜欢的菜品的数字。

费曼所做的，是将餐厅困境转化为决策理论中的一个问题。决策理论是经济学和心理学交叉领域，分析单人博弈中的策略。具体来说，这是对决策理论中一大类问题——被称为“停止问题”（stopping problems）——的独创性贡献。这些问题包括现实生活中，人们必须决定眼前的可能性是否足够好，还是应该继续搜索。

莱顿保存了这些笔记，并在多年后尽力部分转录了费曼那潦草的笔迹。莱顿在21世纪初在线发布的一篇文章中描述了他的解读。十年后，2013年，普林斯顿大学的认知科学家汤姆·格里菲斯（Tom Griffiths）在与计算机科学家兼认知科学家布莱恩·克里斯蒂安（Brian Christian）共同研究一本书时，对这个问题产生了兴趣。格里菲斯随后首次完整转录了费曼的笔记。

目前在加州大学伯克利分校的克里斯蒂安表示，这个问题随后又沉寂了近十年，直到两位研究人员在2021年决定重新审视它。“我们已经理解了费曼笔记的含义，但还有很多工作要做，”他说。研究人员随后证实，费曼确实提出了最佳解决方案，并且还解决了一个该问题的广义版本。

行为与数学的契合：大规模在线实验

克里斯蒂安、格里菲斯与第三位合著者、纽约市立大学的认知心理学家埃文·鲁塞克（Evan Russek）决定测试人们的选择是否会接近数学解决方案。他们将餐厅问题转化为一个在线游戏，招募了2520名参与者进行实验。参与者被指示想象在一个新城市停留一到四周，每晚必须选择一家餐厅用餐。玩家可以通过他们选择的餐厅质量（一个介于1到100之间的数字）赚取积分，并被告知要努力最大化他们的总积分。结果显示，随着访问结束的临近，参与者尝试新餐厅的意愿降低，这与费曼最优公式的逻辑相似。

尽管参与者并未计算出涉及平方根的数学解法，但他们的行为与该解法非常接近。

乔森-希勒尔评论道：“即使在这种简化的设定下，他们仍然发现人们的行为方式相当一致且非常有效，这令人印象深刻。”

乔森-希勒尔指出，尽管费曼的问题在经济学和市场营销领域可能具有应用价值，但它并未完全模拟人们在餐厅的行为。克里斯蒂安补充说，特别是，它没有考虑到“厌倦感”，因为玩家的最优选择是一劳永逸地确定一道菜。在现实生活中，人们可能希望隔三差五地继续选择同一道菜，而在其他访问中继续探索菜单。但克里斯蒂安强调，这个问题“确实以其基本形式提炼出了日常生活中非常熟悉的根本张力：在做你最喜欢的事情和尝试新事物之间做出决定。”