虎嗅

费曼50年前一纸解决“点菜难题”,最近2500人实测结果相差无几

核心内容总结

50年前,物理学家费曼用数学模型解决了朋友的“点菜难题”——到底该继续尝试新菜(探索)还是吃已知的好菜(利用)?他提出了一个“阈值规则”:根据剩余点餐次数设定分数阈值,若已知最好的菜没超过阈值就继续探索,否则就选已知最优。最近科学家通过2520人的实验发现,普通人实际用的“线性阈值策略”(剩余次数越少,阈值越低)和理论最优策略的收益几乎一样(超过95%),说明不用复杂计算,凭直觉的简单策略也能接近最优。

详细解读

1. 费曼的“点菜难题”:用数学破解选择困难症

莱顿(费曼朋友)每次去泰国餐厅都纠结:是吃稳赚不赔的姜汁鸡,还是冒险试新菜?费曼不满足于“先探索后利用”的直觉,用数学建模:假设每道菜的分数是均匀分布(比如0-100分随机),剩余n次点餐时,设定一个阈值(比如n=5时阈值是80分)。如果之前吃过的菜里最高分没到80,就继续试新菜;如果有超过80的,就直接选那个最高分的菜。这个规则能最大化总收益——既不盲目冒险,也不固守旧选择。

2. 和经典“秘书问题”的区别:一次定终身vs多次选最优

费曼的问题属于“最优停止问题”,但和大家熟悉的“秘书问题”(相亲问题)不一样:

  • 秘书问题:你要面试n个秘书,只能看一个拒一个,最后选一个,目标是最大概率选到最优。最优策略是前37%(1/e)不选,后面遇到比之前都好的就选。
  • 费曼餐厅问题:你可以多次去餐厅,能回头吃之前的菜,目标是总收益最大(比如一周吃7次,总分数最高)。两者的核心差异:前者是“单次选择+不能回头”,后者是“多次选择+可回头”。用相亲类比:秘书问题是“一次约会定终身”,费曼问题是“多次约会选总体验最好的”。

3. 2500人实测:普通人的决策策略居然是“线性下降”

科学家设计了虚拟实验:让被试在陌生城市住7/14/28晚,每晚选新餐厅(探索)或已知最好的(利用),餐厅评分来自4种分布(均匀、指数等)。结果发现:

  • 线性阈值:人们的阈值随剩余次数减少直线下降(比如剩10次时阈值80,剩5次时70,剩1次时60)。
  • 早期探索偏向:开头几晚不管有没有好餐厅,都爱试新的(好奇心驱动),这种偏向会随时间快速减弱。
  • 规则简单:被试不用算数学,凭直觉就用了这个策略——剩余次数越少,对新菜的要求越低。

4. 惊人结果:直觉策略收益接近理论最优

科学家对比了“线性阈值策略”和“理论最优策略”的收益:前者居然能达到后者的95%以上!比如最优策略总收益100分,直觉策略能拿95分。原因是:简单策略认知成本低(不用算复杂公式),但效果几乎不差——这就是“启发式决策”的魅力:用最少的思考获得接近最优的结果。

5. 对日常决策的启示:简单策略也能搞定复杂选择

这个研究能帮我们解决生活中的很多选择困难:

  • 找工作:早期多面试(探索),后面遇到比之前都好的offer就接受(利用)。
  • 投资:刚开始试不同基金/股票(探索),找到收益稳定的就长期持有(利用)。
  • 购物:买衣服先逛几家店(探索),遇到性价比最高的就下手(利用)。

关键是:不用追求完美,根据剩余机会调整预期——机会越少,越要接受“足够好”的选择,而不是等“最好”的。

结语

费曼用数学给选择困难症开了药方,而实验证明:我们不用像他那样算公式,凭直觉的简单策略就能接近最优。生活中的很多决策,不用纠结“是不是最好”,只要“足够好”就够了——这或许是这个研究给我们最温暖的慰藉。