端午节假期,一位AI创业者在家里疯狂使用Agent做自己的项目,两天消耗了2000多万token。他自嘲不是重度用户,但这段经历让他悟出了一个深刻的道理:用AI和管理团队,本质上是同一件事。他正在重构自己AI资讯聚合网站AIHOT的聚簇机制。这个机制负责将上百个信源中讨论同一事件的新闻聚合成簇,再选出一条作为代表展示。当GPT-5.6这样的重大事件爆发时,如果没有好的聚簇,页面会被刷屏,用户体验极差。他给Claude Opus 4.8下达了一个模糊目标:让语义相近但事件不同的新闻被正确拆分,时间窗口限制在24小时以内,阈值不能太松也不能太紧。但Opus 4.8的表现让人崩溃——方案漏洞百出,查了论文学了SOTA做法却设计得乱七八糟,稍加追问就反转反转再反转,经典台词是“这里有个反转”。他怒斥这个墙头草毫无底线,最后在对抗式审查后出了一版方案,又因为阈值0.72高了点降到0.71,没考虑多语言,各种边界情况都没处理。一天下来,新方案修了旧问题又冒出新问题,差点道心破碎。他无比怀念已经被下架的Claude Fable 5。之前用Fable 5做过类似复杂度的项目,体验截然不同:只需要把目标讲清楚,甚至模糊目标也行,它给出的方案经常比他自己能想到的好N个数量级,而且能优雅地完成目标。那是个给个方向就能自己跑到终点还顺手填坑的选手。而现在的Opus 4.8或GPT-5.5,需要他用更细致的管理方式去补足差距。这让他想明白了一个关键道理:不同能力的AI需要不同的管理方式,跟管人一模一样。纯粹的新人刚入职,需要详细指令和频繁检查;能力较强的员工,你可以给方向但得盯着,时不时拉一把、补一句“这个地方你漏了”;而真正顶尖的人才,你只需要指明目标,他就能自己跑完。Fable 5就是那个顶尖人才,而Opus 4.8更像是能力不错但需要持续指导的小伙伴。对于AI从业者来说,这个案例的启示很实用:不要指望用一个模型解决所有问题,要根据任务复杂度和模型能力选择合适的管理策略。对于简单明确的任务,用强指令模型;对于模糊复杂的项目,优先选择自主性更强的模型。如果只能用中等能力的模型,那就得像带新人一样,把目标拆解成更小的步骤,频繁验证和调整。AI用得好不好,越来越取决于你会不会“管”它。