
已故美国物理学巨匠理查德·费曼(Richard Feynman)曾将一个看似寻常的晚餐选择难题,巧妙地转化为一道数学谜题:在一家常去的餐厅,我们究竟应该坚持点最爱的菜品,还是冒险尝试新口味?这个困扰无数食客的“探索与利用”两难困境,费曼当年在一张纸上便给出了他的数学解法。
如今,行为科学家们重新审视了费曼的这一解决方案——其中一些曾因他那难以辨认的笔迹而模糊不清——并证实他的策略确实是最优解。这项研究不仅重现了费曼的数学洞察,更通过大规模行为实验,揭示了人类在面对类似决策时的内在逻辑。
费曼的困境对任何餐厅常客来说都耳熟能详:我们是应该继续点目前为止吃过的最好吃的菜,还是应该探索菜单,希望能找到更好的?近期发表在《美国国家科学院院刊》(Proceedings of the National Academy of Sciences)上的一项研究深入探讨了这个问题,并提供了实验证据,表明参与者在选择餐点时所采用的策略,与费曼的数学解法高度近似。
耶路撒冷希伯来大学的行为科学家肖汉姆·乔森-希勒尔(Shoham Choshen-Hillel)称赞该文章“极具创意”。她补充道:“餐厅的例子代表了许多情境下的决策。”现实生活中的例子包括选择购买房屋、决定伴侣以及选择停车位等。
费曼的数学洞察:从餐厅到“停止问题”
故事始于20世纪70年代末,诺贝尔奖得主、加州理工学院物理学家费曼与他的朋友拉尔夫·莱顿(Ralph Leighton)常去格伦代尔附近的一家泰国餐厅。莱顿当时犹豫不决,是该点他最爱的姜汁鸡肉,还是探索菜单上的其他菜品。费曼随即开始涂写计算,并声称他找到了一个数学解决方案:在他简化的模型中,他计算出了一个阈值——一个在超过该次数的访问后,莱顿的理性决策将是始终选择他最喜欢的菜品的数字。
费曼所做的,是将餐厅困境转化为决策理论中的一个问题。决策理论是经济学和心理学交叉领域,分析单人博弈中的策略。具体来说,这是对决策理论中一大类问题——被称为“停止问题”(stopping problems)——的独创性贡献。这些问题包括现实生活中,人们必须决定眼前的可能性是否足够好,还是应该继续搜索。
莱顿保存了这些笔记,并在多年后尽力部分转录了费曼那潦草的笔迹。莱顿在21世纪初在线发布的一篇文章中描述了他的解读。十年后,2013年,普林斯顿大学的认知科学家汤姆·格里菲斯(Tom Griffiths)在与计算机科学家兼认知科学家布莱恩·克里斯蒂安(Brian Christian)共同研究一本书时,对这个问题产生了兴趣。格里菲斯随后首次完整转录了费曼的笔记。
目前在加州大学伯克利分校的克里斯蒂安表示,这个问题随后又沉寂了近十年,直到两位研究人员在2021年决定重新审视它。“我们已经理解了费曼笔记的含义,但还有很多工作要做,”他说。研究人员随后证实,费曼确实提出了最佳解决方案,并且还解决了一个该问题的广义版本。
行为与数学的契合:大规模在线实验
克里斯蒂安、格里菲斯与第三位合著者、纽约市立大学的认知心理学家埃文·鲁塞克(Evan Russek)决定测试人们的选择是否会接近数学解决方案。他们将餐厅问题转化为一个在线游戏,招募了2520名参与者进行实验。参与者被指示想象在一个新城市停留一到四周,每晚必须选择一家餐厅用餐。玩家可以通过他们选择的餐厅质量(一个介于1到100之间的数字)赚取积分,并被告知要努力最大化他们的总积分。结果显示,随着访问结束的临近,参与者尝试新餐厅的意愿降低,这与费曼最优公式的逻辑相似。
尽管参与者并未计算出涉及平方根的数学解法,但他们的行为与该解法非常接近。
乔森-希勒尔评论道:“即使在这种简化的设定下,他们仍然发现人们的行为方式相当一致且非常有效,这令人印象深刻。”
乔森-希勒尔指出,尽管费曼的问题在经济学和市场营销领域可能具有应用价值,但它并未完全模拟人们在餐厅的行为。克里斯蒂安补充说,特别是,它没有考虑到“厌倦感”,因为玩家的最优选择是一劳永逸地确定一道菜。在现实生活中,人们可能希望隔三差五地继续选择同一道菜,而在其他访问中继续探索菜单。但克里斯蒂安强调,这个问题“确实以其基本形式提炼出了日常生活中非常熟悉的根本张力:在做你最喜欢的事情和尝试新事物之间做出决定。”