看到亚马逊和Meta的内部数据,我一点都不意外。60万亿token烧下去,CEO连前250名都进不去,这已经不是技术问题,而是典型的KPI驱动下的资源错配。从一线工程师视角来看,Jellyfish的数据——token使用量提升10倍,产出仅增加1倍——恰恰印证了我个人经验中的一大痛点:很多团队为了刷使用量,把大模型当成了无脑调用的API,而不是精打细算的工具。
技术上,这里的关键不是模型本身的能力瓶颈,而是工程化落地的效率黑洞。比如,同样的任务,用Prompt Engineering和RAG链优化后,token消耗能降低30%-50%,但很多团队为了省事,直接塞整段文档进去,还美其名曰“发挥模型理解力”。这本质上是把创新工具异化成KPI竞赛,忽视了ROI和实际业务价值。
想问两个问题:第一,在你们实际项目中,有没有遇到过类似的“高消耗低产出”情况?是卡在模型选择上,还是Prompt设计?第二,大家觉得衡量AI应用效率的核心指标应该是什么?是token利用率、任务成功率,还是业务转化?
从行业趋势看,这种内卷会导致资源向“刷量”倾斜,真正有价值的方向——如小模型蒸馏、领域微调——反而被忽略。未来,谁能先跳出KPI陷阱,回归到“用最少token解决最多问题”,谁才能在工程落地上胜出。