虎嗅

费曼50年前一纸解决“点菜难题”，最近2500人实测结果相差无几

2026-06-15 阅读原文

核心内容总结

50年前，物理学家费曼用数学模型解决了朋友的“点菜难题”——到底该继续尝试新菜（探索）还是吃已知的好菜（利用）？他提出了一个“阈值规则”：根据剩余点餐次数设定分数阈值，若已知最好的菜没超过阈值就继续探索，否则就选已知最优。最近科学家通过2520人的实验发现，普通人实际用的“线性阈值策略”（剩余次数越少，阈值越低）和理论最优策略的收益几乎一样（超过95%），说明不用复杂计算，凭直觉的简单策略也能接近最优。

详细解读

1. 费曼的“点菜难题”：用数学破解选择困难症

莱顿（费曼朋友）每次去泰国餐厅都纠结：是吃稳赚不赔的姜汁鸡，还是冒险试新菜？费曼不满足于“先探索后利用”的直觉，用数学建模：假设每道菜的分数是均匀分布（比如0-100分随机），剩余n次点餐时，设定一个阈值（比如n=5时阈值是80分）。如果之前吃过的菜里最高分没到80，就继续试新菜；如果有超过80的，就直接选那个最高分的菜。这个规则能最大化总收益——既不盲目冒险，也不固守旧选择。

2. 和经典“秘书问题”的区别：一次定终身vs多次选最优

费曼的问题属于“最优停止问题”，但和大家熟悉的“秘书问题”（相亲问题）不一样：

秘书问题：你要面试n个秘书，只能看一个拒一个，最后选一个，目标是最大概率选到最优。最优策略是前37%（1/e）不选，后面遇到比之前都好的就选。
费曼餐厅问题：你可以多次去餐厅，能回头吃之前的菜，目标是总收益最大（比如一周吃7次，总分数最高）。两者的核心差异：前者是“单次选择+不能回头”，后者是“多次选择+可回头”。用相亲类比：秘书问题是“一次约会定终身”，费曼问题是“多次约会选总体验最好的”。

3. 2500人实测：普通人的决策策略居然是“线性下降”

科学家设计了虚拟实验：让被试在陌生城市住7/14/28晚，每晚选新餐厅（探索）或已知最好的（利用），餐厅评分来自4种分布（均匀、指数等）。结果发现：

线性阈值：人们的阈值随剩余次数减少直线下降（比如剩10次时阈值80，剩5次时70，剩1次时60）。
早期探索偏向：开头几晚不管有没有好餐厅，都爱试新的（好奇心驱动），这种偏向会随时间快速减弱。
规则简单：被试不用算数学，凭直觉就用了这个策略——剩余次数越少，对新菜的要求越低。

4. 惊人结果：直觉策略收益接近理论最优

科学家对比了“线性阈值策略”和“理论最优策略”的收益：前者居然能达到后者的95%以上！比如最优策略总收益100分，直觉策略能拿95分。原因是：简单策略认知成本低（不用算复杂公式），但效果几乎不差——这就是“启发式决策”的魅力：用最少的思考获得接近最优的结果。

5. 对日常决策的启示：简单策略也能搞定复杂选择

这个研究能帮我们解决生活中的很多选择困难：

找工作：早期多面试（探索），后面遇到比之前都好的offer就接受（利用）。
投资：刚开始试不同基金/股票（探索），找到收益稳定的就长期持有（利用）。
购物：买衣服先逛几家店（探索），遇到性价比最高的就下手（利用）。

关键是：不用追求完美，根据剩余机会调整预期——机会越少，越要接受“足够好”的选择，而不是等“最好”的。

结语

费曼用数学给选择困难症开了药方，而实验证明：我们不用像他那样算公式，凭直觉的简单策略就能接近最优。生活中的很多决策，不用纠结“是不是最好”，只要“足够好”就够了——这或许是这个研究给我们最温暖的慰藉。