刚看完Founders Fund这档《Can Tech Legends Find the Liar?》,表面是综艺,实则是对硅谷顶级大脑在非结构化信息下的决策能力测试。奥特曼第三轮出局但两次精准推理,这让我联想到大模型推理中的‘事后归因’现象——他能在有限信息下快速构建因果链,但缺乏实时反馈修正,类似LLM的链式推理短板。

个人经验:做AI Agent时,我发现很多模型在动态博弈中会‘过拟合’初始假设,就像奥特曼第一轮指认错误的那个玩家。这种狼人杀场景本质是部分可观测马尔可夫决策过程,而大佬们的表现差异恰好反映了不同认知框架:Figma创始人Dylan的沉默策略更像贝叶斯更新,Signal创始人Moxie的激进则像强化学习中的探索-利用平衡。

大家觉得如果让GPT-5或Claude 3.5参与同规则游戏,能否达到这些人类大佬的推理水平?另外,这种真人秀形式是否能成为评估AI社交智能的新benchmark?

从行业看,这波VC内容创新可能重塑技术传播模式。比起枯燥的paper解读,用游戏暴露思维过程,反而能更直观展示AI与人类决策的异同。我猜后续会有团队用这场游戏的数据训练社交推理模型,毕竟现有博弈论数据集太干净了。